Skip to main content

ETH Zürich y EPFL están a punto de lanzar un modelo de lenguaje de gran escala y completamente abierto. Eso significa que no solo se podrá usar, sino también examinar, modificar y reutilizar: el código, los datos y los pesos del modelo estarán disponibles para todos.
Fue entrenado en el superordenador Alps, una infraestructura pública ubicada en Suiza, y representa una de las apuestas más ambiciosas de Europa en IA. Hay dos versiones: una con 8 mil millones de parámetros y otra con 70 mil millones. Tamaños comparables a los grandes modelos comerciales, pero sin restricciones de acceso.

Más de 1.500 lenguas, desde el principio

No es un modelo entrenado en inglés y traducido después. Desde la primera línea de código, la diversidad era parte del plan. Cerca del 40 % del corpus de entrenamiento está en otros idiomas. En total, más de 1.500 lenguas presentes, aunque no se ha especificado públicamente cuáles son, y por ahora se desconoce el detalle de las lenguas concretas incluidas. No se trata solo de incluir, sino de representar.

El músculo es público, y se refrigera con agua del lago

El entrenamiento se hizo en “Alps”, el superordenador del CSCS en Lugano. Funciona con más de 10.000 chips Grace Hopper de NVIDIA, refrigerados mediante un sistema que utiliza agua del lago de Lugano, lo que reduce el impacto ambiental y alimentados con electricidad 100 % renovable. Ni nubes privadas, ni servidores lejanos. Todo el proceso, desde el hardware hasta el software, se queda en casa.

Diseñado para ser entendido

Cada línea de código, cada fuente de datos, cada decisión técnica será pública. El modelo se lanza con licencia Apache 2.0, una de las más abiertas. Se ajusta a las leyes suizas y al marco legal europeo, incluidos los requisitos del futuro AI Act. Y lo firman más de 800 investigadores, como parte de la iniciativa Suiza de IA. No es solo ciencia. Es estrategia.

IA abierta, con acento europeo

Suiza no compite por volumen, sino por dirección. Mientras otros modelos se entrenan a puerta cerrada, este se abre desde dentro. Con infraestructura pública, datos auditables y un enfoque multilingüe, propone otra manera de hacer inteligencia artificial. Una que no dependa de permisos, contratos o cajas negras.

Lo que empieza ahora

En las próximas semanas se publicarán los pesos y el código del modelo. Será el momento de probarlo, compararlo, ver qué sabe hacer y qué no. Pero el movimiento ya está hecho: una IA grande, abierta y multilingüe, construida con recursos públicos y energía limpia.

Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.

Dejar un comentario