Investigadores del Centro Alemán de Investigación del Cáncer han desarrollado una inteligencia artificial capaz de anticipar, con base en patrones estadísticos, qué enfermedades podría tener una persona a lo largo de las próximas dos décadas. El modelo, denominado Delphi‑2M, adapta la arquitectura de los transformadores generativos —similares a los de los modelos de lenguaje— para leer y proyectar historias clínicas completas. Más que diagnosticar un problema puntual, busca anticipar recorridos.
Cómo aprende a leer una vida clínica
Según el artículo publicado en Nature, Delphi‑2M fue entrenado con los datos médicos de 402.800 personas del UK Biobank y validado externamente con casi dos millones de historiales daneses. A diferencia de otros modelos centrados en enfermedades específicas, este se entrena con secuencias cronológicas de diagnósticos, enriquecidas con variables demográficas y de estilo de vida, como el tabaquismo, el consumo de alcohol, el sexo o el índice de masa corporal.
El modelo no solo predice qué enfermedades podrían desarrollarse, sino también en qué momento podrían hacerlo. Introduce un mecanismo de predicción temporal para estimar el intervalo entre eventos médicos, lo que permite trazar una evolución probable a lo largo de los años. Además, puede generar trayectorias sintéticas completas, útiles para estudios y simulaciones sanitarias sin comprometer datos reales.
Qué aporta y para qué podría servir
Delphi‑2M estima riesgos para más de mil enfermedades distintas. Sus predicciones permiten detectar vulnerabilidades antes de que aparezcan síntomas, guiar decisiones clínicas preventivas o planificar recursos en sistemas de salud. También permite estudiar la multimorbilidad, es decir, la acumulación de enfermedades a lo largo de la vida, desde una perspectiva más integral.
Los investigadores destacan que, aunque no supera a modelos específicos en algunas enfermedades concretas, su fuerza está en la amplitud y la capacidad de modelar interacciones. La IA no solo ve lo que hay, intenta anticipar lo que podría encadenarse después.
Límites del modelo y del dato
Los propios autores reconocen las limitaciones. El UK Biobank, base del entrenamiento, tiene una muestra con sesgos, personas generalmente más sanas, con mayor nivel educativo y de etnia blanca. Esto afecta la capacidad de generalización del modelo.
Tampoco se incluyen datos genéticos, ambientales o sociales más detallados, y el rendimiento disminuye en personas mayores, donde hay menos datos disponibles. Además, el modelo puede estar capturando patrones de cómo se documenta la salud más que de la salud misma: qué se registra y cuándo, no necesariamente lo que ocurre realmente.
Y, como toda predicción probabilística, los resultados son escenarios posibles, no diagnósticos. Un riesgo elevado no es una sentencia. El desafío está en cómo se interpretan, se comunican y se usan esas predicciones sin caer en alarmismos o decisiones prematuras.
Una herramienta que proyecta, no sentencia
Saber antes no siempre significa saber mejor. La potencia de Delphi‑2M está en su capacidad para crear mapas probabilísticos de futuro, no en ofrecer certezas. En manos clínicas, puede ser una guía. En manos políticas, una herramienta de planificación. Pero en todos los casos requiere mediación, criterio y contexto.
El artículo de Nature concluye que este tipo de modelos podrían redefinir la prevención médica si se integran con cautela. La tecnología está lista para anticipar. Lo que falta por definir es cómo queremos usar ese conocimiento.
Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.