Anthropic ha presentado Claude Opus 4.5, su modelo de IA más avanzado hasta la fecha. Según la empresa, este sistema mejora significativamente en tareas como programación, agentes autónomos y uso de oficina (hojas de cálculo, presentaciones), y marca una nueva fase en lo que las IA pueden hacer en el ámbito profesional.
Diseñado para pensar y hacer
Claude Opus 4.5 está construido para razonar, planificar y ejecutar tareas complejas con intervención humana mínima. Su arquitectura permite manejar contextos largos (hasta 200 000 tokens en pruebas internas), lo que facilita sesiones extensas sin perder coherencia. Introduce además un nuevo parámetro, effort, que permite ajustar el nivel de «esfuerzo cognitivo» que el modelo aplica, o más rápido o más profundo, según la necesidad.
Lo que promete: de código a Excel
Entre las mejoras destacadas, Opus 4.5 muestra un salto en tareas de programación. En el benchmark «SWE-bench Verified», supera a versiones anteriores de Claude y a varios competidores. Además, optimiza el uso de tokens, lo que significa menos coste por tarea. La integración con herramientas de oficina también mejora. Ahora puede interactuar con hojas de cálculo, preparar documentos o mantener sesiones largas sin cortes. El modelo ya está disponible vía API, aplicaciones de escritorio y plataformas como Amazon Bedrock. También reduce precios: US$ 5 por millón de tokens de entrada y US$ 25 por millón de salida.
Datos y entorno bajo el capó
Anthropic no detalla todos los conjuntos de datos empleados, pero afirma que Opus 4.5 mejora en visión, matemáticas y razonamiento frente a sus predecesores. En entornos de desarrollo, permite usar herramientas externas, retener información entre pasos y gestionar interacciones múltiples. La memoria operativa, el manejo del contexto y la capacidad para usar funciones se han reforzado para responder a usos más exigentes.
Las tensiones de una IA más autónoma
Detrás de las mejoras, también surgen dilemas. El enfoque en agentes y herramientas plantea retos de alineación: ¿hasta dónde se puede confiar en sus decisiones? Anthropic sostiene que es su modelo «más robustamente alineado«, y afirma haber reforzado la defensa contra ataques como el prompt injection. Sin embargo, la ampliación del acceso y la baja de precios podría acelerar su adopción sin suficiente supervisión. Esto plantea preguntas sobre su impacto en roles profesionales, especialmente en ingeniería de software.
Dónde se sitúa frente a sus rivales
Comparado con Claude Opus 4.1, la versión 4.5 mejora en eficiencia de tokens y calidad de salida. Frente a modelos como GPT-4.5 o Gemini 3 Pro, se posiciona como fuerte en flujos de trabajo con herramientas y agentes autónomos, aunque sus rivales destacan en tareas multimodales o de razonamiento en bruto. En código rutinario, algunos análisis sugieren que las diferencias ya son mínimas.
Abre un paréntesis en tus rutinas. Suscríbete a nuestra newsletter y ponte al día en tecnología, IA y medios de comunicación.