MiniMax-M1: Modelo de IA con razonamiento largo
Presentamos MiniMax-M1, el primer modelo de razonamiento de atención híbrida a gran escala y de peso abierto del mundo (GitHub).
27 de junio de 2025
Descripción general del modelo
MiniMax-M1 está impulsado por una arquitectura híbrida de Mezcla de Expertos (MoE) combinada con un mecanismo de atención relámpago. El modelo está desarrollado con base en nuestro modelo anterior MiniMax-Text-01 , que contiene un total de 456 mil millones de parámetros con 45,9 mil millones de parámetros activados por token. Consistente con MiniMax-Text-01, el modelo M1 admite de forma nativa una longitud de contexto de 1 millón de tokens, 8 veces el tamaño de contexto de DeepSeek R1. Además, el mecanismo de atención relámpago en MiniMax-M1 permite un escalamiento eficiente del cómputo en tiempo de prueba; por ejemplo, en comparación con DeepSeek R1, M1 consume el 25% de los FLOP en una longitud de generación de 100K tokens. Estas propiedades hacen que M1 sea particularmente adecuado para tareas complejas que requieren procesar entradas largas y pensar extensivamente. MiniMax-M1 se entrena mediante aprendizaje por refuerzo (AR) a gran escala en diversos problemas, desde el razonamiento matemático tradicional hasta entornos de ingeniería de software basados en entornos de pruebas reales. Los experimentos con benchmarks estándar muestran que nuestros modelos superan a otros modelos robustos de peso abierto, como el DeepSeek-R1 original y el Qwen3-235B, especialmente en tareas complejas de ingeniería de software, uso de herramientas y contextos extensos. Con un escalado eficiente del cómputo en tiempo de prueba, MiniMax-M1 sirve como una base sólida para que los agentes de modelos de lenguaje de próxima generación razonen y aborden los desafíos del mundo real (Ibid.).
Comparación del rendimiento de referencia de los principales modelos comerciales y de peso abierto en tareas de matemáticas, programación, ingeniería de software, uso de herramientas de agencia y comprensión de contextos extensos a nivel de competencia. Utilizamos el modelo MiniMax-M1-80k para MiniMax-M1.
Versiones de MiniMax-M1
Existe la versión económica de 80K para trabajos serios y la versión de 40K la cual está bien, pero se queda corta en tareas de código más complejas. Admite llamadas de funciones , se integra con el conjunto completo de API y chat de MiniMax (incluidas imágenes, videos y voz) .
Puedes probarlo en este Chatbot con funciones de búsqueda en línea y la API en línea para desarrolladores o en este espacio de HuggingFace.
Ejemplos de uso
1. Imágenes. Con el Chatbot en el modo agente (Agent), creamos la siguiente imagen:
2. Videos. Con el Chatbot en el modo agente (Agent), creamos el siguiente video:
3. Matemáticas. En HuggingFace le planteamos el siguiente problema: "Un número entero positivo tiene tres cifras. La suma de sus cifras es 15, y el número es divisible por 5. Si se invierte el orden de las cifras, el número resultante es 198 unidades menor que el original. ¿Cuál es el número?". Obteniendo:
Given a three-digit positive integer with the following conditions:
- The sum of its digits is 15.
- The number is divisible by 5.
- When the digits are reversed, the resulting number is 198 units smaller than the original.
Let the number be represented as , where , , and are the hundreds, tens, and units digits respectively.
Key Steps:
- Sum of digits:
- Divisibility by 5: The units digit must be 0 or 5.
- Reversed number condition:
Simplifying the reversed number condition:
Cases for :
Case 1:
- Sum of digits: (invalid, as must be a digit)
Case 2:
- Sum of digits:
Verification:
- The number is .
- Sum of digits:
- Divisibility by 5:
- Reversed number:
- Difference:
Thus, the number is .
4. Aplicaciones web. También en el modo agente, le pedimos. "Crea un archivo HTML5 (css+HTML+js) con una infografía interactiva sobre Minimax M1", para lo cual siguió los siguientes pasos:
Investigar información sobre Minimax M1 usando el Research Agent
Crear el informe detallado en formato markdown
Desarrollar la infografía interactiva HTML5 usando el Website Builder Agent
He aquí la infografía (clic aquí para verlo en una pestaña aparte):
Comentarios
Publicar un comentario
Haz tu comentario, que nos ayude a mejorar