Anthropic anunció el lanzamiento de Claude Opus 4.5, su modelo más reciente de inteligencia artificial, diseñado para mejorar significativamente el rendimiento en tareas complejas de programación, automatización y planificación. Disponible a través de sus aplicaciones, API y principales plataformas en la nube, Opus 4.5 representa una evolución en la arquitectura de modelos orientados a agentes, con mejoras notables en eficiencia de tokens, razonamiento autónomo y alineación en contextos sensibles.
Entre los aspectos destacados del nuevo modelo se encuentra su capacidad para abordar tareas de ingeniería de software en entornos reales. Según pruebas internas, Claude Opus 4.5 supera a sus predecesores en benchmarks como SWE-bench Multilingual y Aider Polyglot, mostrando mejoras de hasta un 10% en resolución de problemas de codificación en múltiples lenguajes. Además, en evaluaciones como Vending-Bench y BrowseComp-Plus, el modelo demostró mayor consistencia en tareas de largo alcance, como la planificación de proyectos y la coordinación entre agentes.
Uno de los elementos más innovadores es el parámetro de “esfuerzo” incorporado en la API, que permite a los desarrolladores ajustar el nivel de procesamiento del modelo según las necesidades de cada tarea. En configuraciones de esfuerzo medio, Opus 4.5 logra resultados comparables a modelos anteriores utilizando hasta un 76% menos de tokens, lo que se traduce en una reducción de costos operativos sin comprometer la calidad.
En cuanto a seguridad, Anthropic afirma que Opus 4.5 es su modelo más robustamente alineado hasta la fecha. Ha mostrado mayor resistencia frente a ataques de inyección de instrucciones maliciosas, un tipo de vulnerabilidad que puede inducir comportamientos no deseados en modelos de lenguaje. Esta mejora responde a la creciente demanda de sistemas confiables en entornos empresariales y críticos, donde la manipulación de datos o decisiones automatizadas requiere altos estándares de integridad.
El modelo también ha sido integrado en herramientas como Claude Code, Claude para Excel y Claude para Chrome, ampliando su aplicabilidad en flujos de trabajo cotidianos. En el caso de Excel, por ejemplo, se reportaron mejoras del 20% en precisión y del 15% en eficiencia en tareas de modelado financiero. En entornos de desarrollo, Opus 4.5 ha demostrado capacidad para coordinar múltiples agentes en paralelo, facilitando tareas como refactorización de código, revisión de pruebas y generación de documentación.
Más allá del rendimiento técnico, el modelo ha sido evaluado en contextos de interacción prolongada, como generación de contenido narrativo y planificación de proyectos. En estos escenarios, Claude Opus 4.5 mostró una comprensión más profunda de las intenciones del usuario, produciendo resultados más coherentes y reutilizables desde el primer intento.
Con este lanzamiento, Anthropic refuerza su enfoque en construir sistemas de IA interpretables, confiables y adaptables, en línea con su misión de avanzar en la seguridad de modelos de frontera. La compañía ha indicado que continuará compartiendo resultados de sus investigaciones sobre el impacto social y económico de estos sistemas en profesiones como la ingeniería, donde ya se observan cambios en la forma de abordar tareas técnicas bajo presión.
Fuente: nota de prensa Anthropic | Editado por CDOL









































