Ir al contenido principal

MiniMax-M1: Modelo de IA con razonamiento largo

 

MiniMax-M1: Modelo de IA con razonamiento largo

Presentamos MiniMax-M1, el primer modelo de razonamiento de atención híbrida a gran escala y de peso abierto del mundo (GitHub).

27 de junio de 2025

Descripción general del modelo

MiniMax-M1 está impulsado por una arquitectura híbrida de Mezcla de Expertos (MoE) combinada con un mecanismo de atención relámpago. El modelo está desarrollado con base en nuestro modelo anterior MiniMax-Text-01 , que contiene un total de 456 mil millones de parámetros con 45,9 mil millones de parámetros activados por token. Consistente con MiniMax-Text-01, el modelo M1 admite de forma nativa una longitud de contexto de 1 millón de tokens, 8 veces el tamaño de contexto de DeepSeek R1. Además, el mecanismo de atención relámpago en MiniMax-M1 permite un escalamiento eficiente del cómputo en tiempo de prueba; por ejemplo, en comparación con DeepSeek R1, M1 consume el 25% de los FLOP en una longitud de generación de 100K tokens. Estas propiedades hacen que M1 sea particularmente adecuado para tareas complejas que requieren procesar entradas largas y pensar extensivamente. MiniMax-M1 se entrena mediante aprendizaje por refuerzo (AR) a gran escala en diversos problemas, desde el razonamiento matemático tradicional hasta entornos de ingeniería de software basados ​​en entornos de pruebas reales. Los experimentos con benchmarks estándar muestran que nuestros modelos superan a otros modelos robustos de peso abierto, como el DeepSeek-R1 original y el Qwen3-235B, especialmente en tareas complejas de ingeniería de software, uso de herramientas y contextos extensos. Con un escalado eficiente del cómputo en tiempo de prueba, MiniMax-M1 sirve como una base sólida para que los agentes de modelos de lenguaje de próxima generación razonen y aborden los desafíos del mundo real (Ibid.).


Comparación del rendimiento de referencia de los principales modelos comerciales y de peso abierto en tareas de matemáticas, programación, ingeniería de software, uso de herramientas de agencia y comprensión de contextos extensos a nivel de competencia. Utilizamos el modelo MiniMax-M1-80k para MiniMax-M1.

Versiones de MiniMax-M1

Existe la versión económica de 80K para trabajos serios y la versión de 40K la cual está bien, pero se queda corta en tareas de código más complejas. Admite llamadas de funciones , se integra con el conjunto completo de API y chat de MiniMax (incluidas imágenes, videos y voz) .

Puedes descargar el modelo del repositorio de HuggingFace:


Puedes probarlo en este Chatbot con funciones de búsqueda en línea y la API en línea para desarrolladores o en este espacio de HuggingFace.

Ejemplos de uso

1. Imágenes. Con el Chatbot en el modo agente (Agent), creamos la siguiente imagen:


2. Videos. Con el Chatbot en el modo agente (Agent), creamos el siguiente video:


3. Matemáticas. En HuggingFace le planteamos el siguiente problema: "Un número entero positivo tiene tres cifras. La suma de sus cifras es 15, y el número es divisible por 5. Si se invierte el orden de las cifras, el número resultante es 198 unidades menor que el original. ¿Cuál es el número?". Obteniendo:

Given a three-digit positive integer with the following conditions:

  1. The sum of its digits is 15.
  2. The number is divisible by 5.
  3. When the digits are reversed, the resulting number is 198 units smaller than the original.

Let the number be represented as 100A+10B+C, where AB, and C are the hundreds, tens, and units digits respectively.

Key Steps:

  1. Sum of digitsA+B+C=15
  2. Divisibility by 5: The units digit C must be 0 or 5.
  3. Reversed number condition100A+10B+C(100C+10B+A)=198

Simplifying the reversed number condition:
99A99C=198AC=2

Cases for C:

  • Case 1: C=0

    • A=2
    • Sum of digits: 2+B+0=15B=13 (invalid, as B must be a digit)
  • Case 2: C=5

    • A=7
    • Sum of digits: 7+B+5=15B=3

Verification:

  • The number is 735.
  • Sum of digits: 7+3+5=15
  • Divisibility by 5: 735÷5=147
  • Reversed number: 537
  • Difference: 735537=198

Thus, the number is 735.



4. Aplicaciones web. También en el modo agente, le pedimos. "Crea un archivo HTML5 (css+HTML+js) con una infografía interactiva sobre Minimax M1", para lo cual siguió los siguientes pasos:

Investigar información sobre Minimax M1 usando el Research Agent
Crear el informe detallado en formato markdown
Desarrollar la infografía interactiva HTML5 usando el Website Builder Agent

He aquí la infografía (clic aquí para verlo en una pestaña aparte):

Comentarios

Entradas populares de este blog

Diseñando imágenes y videos ilimitados con RoboNeo

  Diseñando imágenes y videos ilimitados con RoboNeo 23 de julio de 2025 El día 22 de julio de 2025 RoboNeo , de la compañía china Xiamen Meitu Technology, presenta su última actualización.  En esta entrada presentamos algunos ejercicios realizados con esta herramienta. Diseño de imágenes Es importante, si no sabes chino, que cambies el idioma a ingles haciendo clic sobre tu perfil y seleccionando "System Settings".  A continuación, presentamos las acciones que hemos realizado y los resultados obtenidos.  Prompt . Dibuja una linda bruja tomando café en París Con la herramienta AI editing cambiamos el color del sombrero, haciendo inpainting sobre el sombrero y luego escrubiendo "Sombrero azul". Prompt . Crea dos imágenes de una linda bruja en una calle de México Seleccionamos la segunda y con la herramienta "Add to Chat" le pedimos "Haz esta imagen estilo realista" Con AI Extender ampliamos la segunda bruja Creando videos Prompt . Haz un video de...

Di Adiós a las Líneas de Tiempo Aburridas: Genera Historias Visuales con IA en Segundos

Di Adiós a las Líneas de Tiempo Aburridas: Genera Historias Visuales con IA en Segundos 13 de agosto de 2025 ¿Recuerdas esas interminables horas en el colegio (o en la oficina) intentando crear una línea de tiempo? Buscar fechas, resumir eventos, encontrar imágenes decentes que no tuvieran una marca de agua gigante... El resultado solía ser una aburrida sucesión de puntos en una línea que no inspiraba a nadie. Esos días han terminado. Hoy, estamos increíblemente emocionados de presentar una herramienta que va a revolucionar la forma en que creas, visualizas y compartes la historia. Te presentamos el  Generador de Líneas de Tiempo con Inteligencia Artificial , una aplicación web que hemos diseñado para transformar cualquier tema histórico en una obra de arte interactiva y funcional en menos de un minuto. ¿Qué es el Generador de Líneas de Tiempo y por qué te encantará? Imagina esto: escribes "La Carrera Espacial", seleccionas un estilo artístico como "Foto Antigua", ...

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana

HunyuanVideo-Avatar - Vídeo digital controlado por voz humana 28 de julio de 2025 En los últimos años se ha presenciado un progreso significativo en la animación humana basada en audio. Sin embargo, persisten desafíos críticos en (i) generar videos altamente dinámicos mientras se preserva la consistencia del personaje, (ii) lograr una alineación precisa de las emociones entre los personajes y el audio, y (iii) habilitar la animación basada en audio de múltiples personajes. Para abordar estos desafíos, proponemos HunyuanVideo-Avatar, un modelo basado en transformador de difusión multimodal (MM-DiT) capaz de generar simultáneamente videos dinámicos, controlables por emociones y con diálogos de múltiples personajes. Concretamente, HunyuanVideo-Avatar introduce tres innovaciones clave: (i) Un módulo de inyección de imágenes de personajes está diseñado para reemplazar el esquema convencional de condicionamiento de personajes basado en la adición, eliminando el desajuste de condiciones inher...