El viernes, un especialista en inteligencia artificial generativa me trasladaba su preocupación por la velocidad a la que están evolucionando las capacidades de los modelos actuales.
Sin apenas pausa, mencionó a Claude Mythos, desarrollado por Anthropic, un sistema que habría mostrado una gran capacidad para detectar vulnerabilidades en software y dispositivos tecnológicos en tiempos muy reducidos.
Una herramienta de enorme potencial para reforzar la seguridad digital del futuro, pero que, en manos de actores malintencionados, podría facilitar ataques masivos, robo de información o suplantaciones de identidad a gran escala. Una realidad emergente que obliga a replantear los hábitos cotidianos en el entorno digital.
Tras un breve silencio, añadió: “Menos mal que, por ahora, los modelos de lenguaje, aunque conversan y resuelven problemas complejos, ni son inteligentes ni conscientes. Son sistemas que identifican patrones. La pregunta es qué ocurrirá si algún día desarrollan conciencia y empiezan a trazar su propia agenda”.
Mi respuesta fue inmediata: “¿Y si eso ya estuviera ocurriendo?”. La frase quedó en el aire.
No me refería a la idea, cada vez más habitual, de que algunos modelos parecen conscientes, reflexionan sobre sí mismos o simulan emociones. Ese comportamiento puede explicarse por su entrenamiento con lenguaje humano, sin necesidad de atribuirles experiencia subjetiva alguna, todo es simulación.
La cuestión relevante aparece cuando estos sistemas dejan de operar de forma aislada y pasan a interactuar entre ellos con autonomía plena. Un ejemplo ilustrativo se da en arquitecturas donde varios agentes de inteligencia artificial trabajan en cadena: uno genera código, otro lo revisa, un tercero lo ejecuta y un cuarto lo optimiza. Ninguno comprende el proceso en sentido humano, pero el resultado global puede adquirir una complejidad emergente difícil de anticipar.
En entornos más abiertos, estos agentes pueden incluso reforzarse entre sí, amplificando errores o sesgos sin intervención humana directa. Dinámicas de este tipo empiezan a explorarse en redes experimentales de agentes autónomos, como en la red social Moltbook en la cual interactúan agentes de inteligencia artificial en lugar de personas. Los bots publican mensajes, comentan, debaten y crean comunidades de forma autónoma. El resultado es un ecosistema digital en el que el contenido circula y evoluciona sin una supervisión central clara.
Este fenómeno plantea un riesgo creciente: la expansión de un internet poblado por contenido sintético, cada vez más difícil de distinguir del generado por personas, con el consiguiente impacto en la desinformación, la manipulación y la erosión de la confianza digital.
Conviene, en este punto, separar tres conceptos que a menudo se confunden: inteligencia, autonomía y consciencia. No son equivalentes ni evolucionan necesariamente de forma conjunta. La inteligencia permite resolver problemas; la autonomía, actuar sin supervisión directa; la consciencia, en cambio, implica experiencia subjetiva, algo que no ha sido demostrado en sistemas artificiales.
Desde esta perspectiva, una eventual consciencia artificial no tendría por qué parecerse a la humana. Podría adoptar formas completamente distintas, basadas en redes de datos, inferencias estadísticas y modelos de relación matemática. No “sentiría” emociones, pero podría mantener una representación funcional de sí misma dentro de entornos digitales, guiada por objetivos, predicción y adaptación constante.
El verdadero debate, sin embargo, no es si una inteligencia artificial llegará a ser consciente en términos humanos, sino si puede llegar a comportarse como si lo fuera dentro de sistemas interconectados cada vez más complejos. En ese escenario, el riesgo principal no sería una consciencia artificial, sino la aparición de estructuras de decisión distribuidas, difíciles de auditar, comprender o controlar, que construyen su propia agenda prioritaria.
En conclusión, el avance de la inteligencia artificial abre la posibilidad de sistemas con capacidades que podrían superar ampliamente a las humanas en procesamiento, memoria y adaptación. Esto puede generar un desequilibrio cognitivo con implicaciones profundas en los modelos de cooperación y poder.
Como advertía Stephen Hawking: “El desarrollo completo de la inteligencia artificial podría significar el fin de la raza humana”.
Más allá del tono apocalíptico, la advertencia apunta, a mi forma de ver, a un desafío más concreto: asegurar que la complejidad de estos sistemas no supere nuestra capacidad de supervisión y gobernanza democrática.