Mistral, una startup con base en París, ha lanzado su modelo más reciente, el Large 2, posicionándose como un serio competidor frente a los modelos de última generación de gigantes como Meta y OpenAI. Este nuevo modelo promete no solo igualar, sino superar en varios aspectos clave a sus predecesores en el ámbito de la generación de código y resolución de problemas matemáticos.
El lanzamiento del Mistral Large 2 se produjo apenas un día después de que Meta presentara su modelo más avanzado, el Llama 3.1 405b, marcando una rápida sucesión de innovaciones en el campo de la inteligencia artificial. Mistral afirma que su modelo Large 2 establece un nuevo estándar en términos de rendimiento y costo para modelos abiertos, respaldando esta afirmación con una serie de pruebas de referencia en las que Large 2 ha demostrado superar al Llama 3.1 405B en generación de código y desempeño matemático, y lo hace con menos de un tercio de los parámetros, específicamente 123.000 millones.
Una de las áreas clave en las que Mistral ha centrado sus esfuerzos durante el entrenamiento de Large 2 es la minimización de los problemas de «alucinación» del modelo, un desafío común donde los modelos generan respuestas inventadas que parecen plausibles. Mistral declara que Large 2 ha sido entrenado para ser más crítico en sus respuestas, reconociendo cuando no sabe algo en lugar de inventar una respuesta.
Además de su impresionante capacidad técnica, Mistral ha conseguido captar una significativa inversión de capital, asegurando $640 millones en una ronda de financiación Serie B liderada por General Catalyst, lo que valoriza a la empresa en 6.000 millones de dólares. A pesar de ser uno de los nuevos participantes en el espacio de la inteligencia artificial, Mistral ya está entregando modelos de IA que rivalizan o se sitúan cerca de la vanguardia tecnológica.
Sin embargo, es importante notar que los modelos de Mistral, al igual que la mayoría de los demás, no son de código abierto en el sentido tradicional. Cualquier aplicación comercial del modelo requiere una licencia de pago. Y aunque son más abiertos que, por ejemplo, el GPT-4o, pocas personas en el mundo tienen la experiencia y la infraestructura necesarias para implementar un modelo de tan gran envergadura.
Un aspecto que falta en Mistral Large 2, y que también estuvo ausente en el lanzamiento del Llama 3.1 de Meta, son las capacidades multimodales. OpenAI sigue siendo líder en sistemas de IA multimodales, capaces de procesar imagen y texto simultáneamente, una característica que algunas startups están buscando desarrollar cada vez más.
Toda revolución necesita sus cronistas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.