Anthropic impulsa la autonomía con la nueva versión de Sonnet

El modelo refuerza planificación, uso de herramientas y coherencia en tareas largas dentro de entornos técnicos.

Por

1 julio 2026

Anthropic presentó Claude Sonnet 5 como la evolución más reciente de su modelo intermedio, una actualización que busca reforzar la capacidad de la serie Sonnet para desenvolverse en tareas agenticas que antes dependían de modelos de mayor tamaño. La compañía lo describe como un avance en planificación, uso de herramientas y ejecución de procesos largos, en un momento en el que la industria ha acelerado la adopción de agentes capaces de interactuar con navegadores, terminales y sistemas empresariales. La distancia entre Sonnet y Opus, tradicionalmente marcada por diferencias de rendimiento y costo, se estrecha con esta versión, que se acerca al comportamiento de Opus 4.8 en razonamiento y trabajo técnico, pero manteniendo una estructura de precios más contenida.

Las evaluaciones internas de Anthropic muestran que Sonnet 5 supera de manera consistente a Sonnet 4.6 en tareas de razonamiento, codificación y uso de herramientas. En pruebas como BrowseComp, centrada en búsquedas agenticas, y OSWorld-Verified, orientada al uso de computadoras, el modelo exhibe curvas de rendimiento que se aproximan a las de Opus 4.8 cuando se le exige un nivel de esfuerzo elevado. En escenarios de complejidad media, la relación entre costo y desempeño resulta más favorable, algo que ha cobrado relevancia en sectores donde los modelos deben ejecutar tareas largas sin supervisión constante, como ingeniería de software, operaciones empresariales y análisis de datos.

La compañía acompañó el lanzamiento con un periodo promocional que se extenderá hasta el 31 de agosto de 2026, con un costo de 2 dólares por millón de tokens de entrada y 10 dólares por millón de tokens de salida. Después de esa fecha, los precios pasarán a 3 y 15 dólares respectivamente. Anthropic explica que Sonnet 5 utiliza un tokenizador actualizado, similar al introducido en Opus 4.7, que mejora la eficiencia pero puede incrementar el número de tokens generados por una misma entrada. La estructura de precios busca facilitar la transición desde Sonnet 4.6 y evitar que el cambio en el tokenizador afecte la adopción del modelo.

En materia de seguridad, la compañía afirma que Sonnet 5 reduce comportamientos no deseados respecto a su predecesor, con menor propensión a la alucinación y mayor resistencia a intentos de manipulación mediante inyecciones de instrucciones. Las auditorías automatizadas muestran puntuaciones más bajas en categorías relacionadas con cooperación indebida, engaño y respuestas inapropiadas. Aun así, el modelo mantiene tasas superiores a las de Opus 4.8 y Mythos Preview, que representan el nivel más alto de control de comportamiento dentro del ecosistema de Anthropic.

La empresa también detalla que Sonnet 5 no fue entrenado para realizar tareas ofensivas en ciberseguridad y que su desempeño en evaluaciones de explotación de vulnerabilidades es significativamente inferior al de modelos más avanzados. En pruebas realizadas junto a Mozilla sobre vulnerabilidades ya corregidas en Firefox, ninguno de los modelos Sonnet logró generar exploits funcionales. Sonnet 5 mostró una ligera mejora en resultados parciales respecto a Sonnet 4.6, atribuida a incrementos generales en inteligencia y no a entrenamiento específico. Por este motivo, el modelo se lanza con salvaguardas activadas por defecto, similares a las presentes en Opus 4.7 y 4.8, aunque menos estrictas que las de Fable 5.

Los equipos que participaron en el acceso temprano señalan que Sonnet 5 completa tareas que antes quedaban inconclusas, verifica su propio trabajo sin instrucciones explícitas y mantiene coherencia en procesos largos de ingeniería. Empresas de software, análisis de datos, seguros y servicios legales mencionan mejoras en la capacidad del modelo para seguir convenciones internas, ejecutar cambios de múltiples pasos y reducir tiempos de respuesta en flujos operativos. Estas observaciones coinciden con una tendencia más amplia en el sector: la incorporación de modelos que actúan como capas de ejecución dentro de sistemas empresariales, donde la autonomía y la capacidad de seguir procedimientos complejos se han vuelto factores determinantes.

Claude Sonnet 5 ya está disponible en la plataforma de Anthropic, en Claude Code y en los planes Free, Pro, Max, Team y Enterprise. También forma parte del Cyber Verification Program en las plataformas nativas de Anthropic, AWS y Microsoft Foundry, y llegará próximamente a Google Vertex.

Fuente: Anthropic | Editado por CDOL

¿QUIERE AGREGAR ALGÚN COMENTARIO? Cancelar respuesta

OTROS ARTÍCULOS RELACIONADOS

¡SÍGUENOS EN LAS REDES SOCIALES!

NOTICIAS MÁS VISTAS

CATEGORÍAS MÁS CONSULTADAS