Anthropic presentó Claude Opus 4.6, una actualización de su modelo más avanzado, centrada en mejorar la planificación, la fiabilidad en tareas prolongadas y el rendimiento en entornos de programación extensos. La compañía describe esta versión como un paso adelante en la capacidad del modelo para sostener procesos de trabajo que requieren múltiples etapas, razonamiento profundo y uso autónomo de herramientas.
El modelo incorpora mejoras en codificación, revisión de código y depuración, con un comportamiento más consistente en bases de código amplias. También introduce, por primera vez en la línea Opus, una ventana de contexto de un millón de tokens en fase beta, lo que permite manejar grandes volúmenes de información sin degradación significativa del rendimiento. Esta ampliación se complementa con mecanismos de “compaction” que resumen partes del contexto para evitar límites durante tareas extensas.
Además de las capacidades técnicas, Opus 4.6 amplía su utilidad en actividades cotidianas de oficina. Puede ejecutar análisis financieros, realizar búsquedas complejas, trabajar con documentos y generar presentaciones o hojas de cálculo. En el entorno Cowork, donde Claude opera de forma autónoma con múltiples tareas simultáneas, estas mejoras se integran para sostener flujos de trabajo más largos y menos dependientes de supervisión humana.
Las evaluaciones internas y externas muestran avances en áreas como razonamiento multidisciplinario, codificación con agentes, búsqueda de información difícil de localizar y desempeño en tareas de conocimiento económico. En pruebas como Terminal-Bench 2.0 o Humanity’s Last Exam, el modelo se sitúa entre los más sólidos del sector. También destaca en BrowseComp, una evaluación centrada en la capacidad de encontrar información en la web, y en GDPval-AA, donde supera a modelos de referencia en tareas de valor económico.
En contextos de trabajo reales, los primeros usuarios reportan que el modelo aborda problemas ambiguos con mayor criterio, revisa su propio razonamiento antes de ofrecer una respuesta y mantiene la productividad en sesiones prolongadas. Estas características se reflejan en casos de uso que van desde la depuración de código hasta la gestión de proyectos con múltiples agentes.
Anthropic también subraya que las mejoras en capacidad no han comprometido la seguridad. El modelo mantiene tasas bajas de comportamientos no alineados y reduce las “sobre-rechazos”, situaciones en las que un modelo evita responder a solicitudes benignas. La empresa aplicó nuevas pruebas de bienestar del usuario, evaluaciones de rechazo adecuado y análisis de acciones potencialmente dañinas. En el ámbito de ciberseguridad, donde el modelo muestra habilidades avanzadas, se añadieron salvaguardas específicas y nuevos métodos de detección de respuestas riesgosas.
Junto con el modelo, la plataforma para desarrolladores incorpora funciones como “adaptive thinking”, que permite al sistema decidir cuándo aplicar razonamiento extendido, y nuevos niveles de esfuerzo para ajustar velocidad, coste y profundidad. También se habilita la salida de hasta 128.000 tokens y la opción de inferencia exclusivamente en Estados Unidos para cargas de trabajo con requisitos regulatorios.
En el plano de producto, Claude Code introduce equipos de agentes capaces de trabajar en paralelo, una función pensada para tareas que pueden dividirse en subtareas independientes. Las integraciones con Excel y PowerPoint también se amplían, permitiendo procesar datos no estructurados, planificar antes de ejecutar acciones y generar presentaciones coherentes con los estilos corporativos.
Claude Opus 4.6 está disponible en claude.ai, en la API y en las principales plataformas en la nube, con la misma estructura de precios que la versión anterior. Con esta actualización, Anthropic busca consolidar un modelo capaz de sostener tareas complejas, manejar grandes volúmenes de información y ofrecer un comportamiento más estable en escenarios profesionales diversos.
Fuente: nota de prensa Anthropic | Editado por CDOL









































