El modelo abierto y multilingüe de ETH Zurich y EPFL ya se puede descargar, probar y adaptar
Se anunció como una rareza, un modelo de lenguaje multilingüe entrenado en una supercomputadora pública, con todos sus datos abiertos y sin barreras de uso. Hoy ya es una realidad. Apertus, la IA suiza diseñada como infraestructura pública, ha sido lanzada oficialmente. Y ahora no se habla de promesas, sino de accesos reales, aplicaciones inmediatas y preguntas que empiezan a concretarse.
Qué se puede hacer desde ya
Apertus ya está disponible en Hugging Face y en la plataforma de inferencia pública de ETH Zurich y CSCS. También desde Swisscom, aunque en ese caso, limitado a usuarios dentro de Suiza. Hay dos versiones para elegir: una más ligera (8B) y otra más potente (70B). Ambas se pueden descargar, integrar en productos o usar directamente desde web, sin pagar ni pedir permiso.
Y ya están surgiendo las primeras pruebas. Desde chatbots en romanche, modelos jurídicos en francés suizo, resúmenes en alemán dialectal… La comunidad educativa lo está explorando para crear asistentes multilingües en clase. Algunas startups de salud y legaltech ya lo han citado como base para sus próximos pilotos.
Qué se confirma del modelo
Apertus se entrenó, como se prometió, con más de 15 billones de tokens y textos en más de mil idiomas. Al menos un 40 % no están en inglés. Los responsables han confirmado que sí se incluyó contenido en suizo alemán, romanche y otros idiomas minoritarios, lo que lo convierte en el modelo más diverso en su base lingüística hasta la fecha.
Los pesos del modelo, los checkpoints, las instrucciones de entrenamiento y el conjunto de datos están todos publicados. La licencia Apache 2.0 sigue vigente, lo que permite incluso uso comercial, siempre que se mencione la autoría. Y las barreras técnicas se han reducido, ya hay imágenes Docker listas para usar sin complicaciones.
Lo que cambia ahora que está disponible
Con el modelo ya en la calle, cambia el tipo de discusión. Ya no se debate si es posible una IA pública, sino cómo se gestiona. ¿Qué tipo de proyectos la usarán primero? ¿Qué límites éticos aparecen cuando cualquier persona puede descargar un modelo potente, entrenarlo con nuevos datos y desplegarlo sin control?
ETH Zurich ha publicado una guía de uso responsable y mantiene filtros en la interfaz pública. Pero si alguien clona el modelo y lo adapta para desinformación, no habrá freno inmediato. Esa es la tensión de fondo, lo radical de la apertura también implica soltar el control.
Primeras comparativas: ¿cómo se comporta?
Apertus no supera a modelos como GPT-4 en precisión o contexto, pero compite en multilingüiemso y transparencia. Las primeras pruebas indican que en tareas en alemán suizo o francés suizo ofrece resultados más naturales que modelos estadounidenses, porque fue entrenado con corpus locales reales.
En tareas generales, su rendimiento es sólido pero no puntero. No tiene funciones avanzadas como navegación web o razonamiento multimodal. Pero sí tiene algo que los grandes no: la posibilidad de auditarlo línea por línea, adaptarlo sin restricciones y desplegarlo en infraestructuras propias.
Qué se empieza a mover en torno a él
En las próximas semanas se celebrarán las Swiss {ai} Weeks, donde Apertus será el núcleo de hackatones, talleres y pruebas de campo. El objetivo no es solo mostrar el modelo, sino animar a universidades, municipios, startups y colectivos a construir sobre él. También se esperan forks temáticos como: Apertus Salud, Apertus Jurídico, Apertus Educación.
Y al margen de Suiza, ya hay centros en Barcelona, Helsinki y São Paulo que están probándolo como alternativa a modelos cerrados en proyectos públicos.
Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.