Skip to main content

El 21 de julio de 2025 marca un hito en la historia de la inteligencia artificial: Google DeepMind dio a conocer que su avanzada versión de Gemini Deep Think alcanzó puntaje de medalla de oro en la pasada Olimpiada Internacional de Matemáticas (IMO). El sistema resolvió cinco de los seis problemas, equivalentes a una puntuación de 35 sobre 42, dentro del límite de 4,5 horas, completamente en lenguaje natural y sin asistencia humana.

De la plata a la gloria

En la edición anterior, DeepMind había logrado medalla de plata con una combinación de AlphaProof y AlphaGeometry 2, basándose en traducciones a lenguajes formales como Lean y cálculos que llevaron hasta varios días. Esta vez, Gemini demostró su evolución: razonó, explicó y probó directamente en lenguaje natural, dentro del mismo tiempo que los estudiantes, eliminando traducciones manuales y tiempos de cómputo prolongados.

Deep Think: pensamiento paralelo

El motor Deep Think emplea técnicas avanzadas de razonamiento paralelo, explorando múltiples caminos simultáneamente antes de consolidar la respuesta más robusta. Este enfoque, junto con un reforzamiento entrenado con corpus de soluciones matemáticas y «hints» estructurados, permitió que el sistema generara pruebas claras, precisas y legibles para los calificadores de la IMO.

Validación oficial y reconocimiento

A diferencia de OpenAI, que también reportó puntaje de oro resolviendo cinco problemas, la versión de Gemini fue parte de una «cohorte inaugural» cuyos resultados fueron oficialmente evaluados y certificados por los corregidores de la IMO. Esta certificación refuerza la solidez del logro. Según Gregor Dolinar, presidente de la IMO, las soluciones «fueron claras, precisas y fáciles de seguir».

IA generalista vs. especializada

Tanto DeepMind como OpenAI usaron modelos orientados al razonamiento general. OpenAI potenció su modelo con «test‑time compute» intensivo y razonamiento paralelo. No obstante, mientras Gemini enfatizó su nuevo sistema de Deep Think con interacción paralela y aprendizaje reforzado, el modelo de OpenAI empleó una estrategia más centrada en mantener múltiples trayectorias de razonamiento durante el examen.

¿Qué viene ahora?

Ambas compañías consideran este avance como preludio de una colaboración creativa entre IA y matemáticos, con aplicaciones potenciales en áreas avanzadas como la física. Aunque ninguna de las dos liberará estos modelos al público en el corto plazo, OpenAI anticipa meses y DeepMind lanzará un piloto para «trusted testers», el registro oficial de Gemini y su desempeño dentro del tiempo real abren una nueva era en la colaboración hombre‑máquina.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.

Dejar un comentario