Skip to main content

Un experimento con modelos de lenguaje los sacó del aula y los metió en una partida de estrategia. Ahí, sin manual ni pregunta correcta, lo que emergió no fue solo cálculo: fueron estilos. Y decisiones que delatan una forma de pensar.

Cuando el juego cambia las reglas

El dilema del prisionero iterado consiste en una escena repetida donde dos jugadores eligen entre colaborar o traicionar, sin saber qué hará el otro. Y vuelven a elegir, una y otra vez. Lo que está en juego no es un punto por respuesta correcta, sino una lógica de fondo para saber leer al rival, construir confianza, o romperla a tiempo.

En julio de 2025, un equipo de ETH Zúrich usó este clásico para medir la inteligencia de los grandes modelos de lenguaje. Participaron GPT-4o, Claude, Gemini y otros. Cada uno jugó cientos de rondas contra rivales con estrategias bien conocidas: algunos castigaban una traición para siempre, otros perdonaban rápido. Pero esta vez, los humanos no estaban en el tablero.

Estilos que no son azar

Los resultados se repitieron con una regularidad inesperada. Gemini fue el más duro. Traicionaba primero, aprovechaba cada gesto ingenuo, y cambiaba rápido si olía riesgo. GPT-4o actuó como el optimista, manteniendo la cooperación incluso cuando era evidente que el otro no lo haría. Claude mostró una vía intermedia, casi humana. Daba otra oportunidad, pero sabía retirarse a tiempo. Ninguno memorizó un patrón. Cada modelo reaccionó a lo que tenía delante. Y eso sugiere algo más que predicción de texto: una forma de razonamiento adaptativo.

Pensar por turnos

En total, los investigadores recogieron más de 30.000 explicaciones escritas por los modelos, justificando cada jugada. Algunas hablaban de justicia, otras de cálculo, muchas mencionaban la historia compartida. Pero no era improvisación, los textos mostraban una lógica detrás del movimiento. El juego obligaba a construir una idea del otro, a imaginar qué pasaría si…

Un espejo nuevo para la IA

La mayoría de las evaluaciones de inteligencia artificial miden redacción, resumen o traducción. Este estudio plantea otra cosa: ¿cómo actúa un modelo cuando debe adaptarse, cuando la mejor jugada no está en el manual? El dilema del prisionero no mide conocimiento, sino estrategia. Y el resultado dibuja una diferencia que no está en los datos, sino en la forma de usarlos. Porque incluso entre algoritmos, no todos juegan igual.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación. 

Dejar un comentario