Evolución en la línea Opus: Anthropic impulsa la autonomía y la consistencia del modelo

La compañía introduce mejoras en planificación, visión de alta resolución y herramientas para desarrolladores.

0
6
Foto cortesia de Anthropic

Anthropic anunció la disponibilidad general de Claude Opus 4.7, una versión que profundiza en tareas de ingeniería de software complejas y en flujos de trabajo prolongados. La compañía describe el modelo como una evolución directa de Opus 4.6, con mejoras en razonamiento sostenido, manejo de instrucciones y capacidad para verificar sus propias salidas antes de responder. Estas características buscan reducir la supervisión humana en procesos que tradicionalmente requerían atención continua.

Según la información publicada, Opus 4.7 muestra avances en la ejecución de tareas largas y en la consistencia de sus resultados. Los primeros usuarios destacan que el modelo detecta fallos lógicos durante la fase de planificación y mantiene la coherencia en operaciones que se extienden durante horas. En ingeniería de software, varios equipos reportan incrementos en la resolución de problemas, mayor precisión en revisiones de código y una reducción de errores en flujos CI/CD y automatizaciones complejas.

La visión también recibe una actualización relevante: el modelo puede procesar imágenes de mayor resolución, lo que amplía su utilidad en análisis técnicos, lectura de diagramas densos o interpretación de estructuras químicas. Esta capacidad se integra sin cambios en la API, aunque implica un mayor consumo de tokens cuando se utilizan imágenes de alta fidelidad.

Un modelo con mejoras, pero con límites deliberados en ciberseguridad
La publicación sitúa Opus 4.7 dentro de la estrategia anunciada recientemente con Project Glasswing, en la que Anthropic expone riesgos y beneficios de modelos avanzados en ciberseguridad. La empresa mantiene un lanzamiento restringido de Claude Mythos Preview —su modelo más potente— y prueba nuevas salvaguardas en versiones menos capaces antes de ampliar su disponibilidad.

En este contexto, Opus 4.7 incorpora mecanismos automáticos para bloquear solicitudes asociadas a usos prohibidos o de alto riesgo en ciberseguridad. Anthropic señala que durante el entrenamiento se experimentó con técnicas para reducir diferencialmente estas capacidades. Los profesionales que necesiten emplear el modelo en actividades legítimas —como investigación de vulnerabilidades o pruebas de penetración— pueden solicitar acceso al nuevo Cyber Verification Program.

Rendimiento en evaluaciones y retroalimentación temprana
La nota incluye testimonios de empresas que han probado el modelo en ámbitos como desarrollo de software, análisis financiero, revisión legal, automatización empresarial y agentes autónomos. En general, los comentarios apuntan a una mayor profundidad de razonamiento, mejor manejo de contextos extensos y una reducción de errores en tareas que requieren múltiples pasos.

En benchmarks internos, Opus 4.7 supera a Opus 4.6 en áreas como lógica deductiva, análisis financiero, razonamiento multimodal y coherencia a largo plazo. También muestra mejoras en la resistencia a bucles, la recuperación ante fallos de herramientas y la precisión en llamadas a funciones dentro de agentes. En evaluaciones externas citadas por Anthropic, el modelo incrementa la resolución de tareas de ingeniería, mejora la calidad del código y reduce la variabilidad en entornos de producción.

Seguridad, alineamiento y comportamiento del modelo
Anthropic afirma que el perfil de seguridad de Opus 4.7 es similar al de su predecesor, con tasas bajas de comportamientos preocupantes como la cooperación con usos indebidos o la generación de contenido engañoso. En algunos aspectos —como la resistencia a ataques de inyección de instrucciones— el modelo mejora, mientras que en otros —como el nivel de detalle en consejos sobre sustancias controladas— muestra ligeros retrocesos. La evaluación de alineamiento concluye que el modelo es “en gran medida fiable”, aunque no ideal.

La compañía recuerda que Claude Mythos Preview sigue siendo su modelo mejor alineado según sus métricas internas, y que las lecciones obtenidas con Opus 4.7 contribuirán a una futura ampliación de acceso a modelos más avanzados.

Nuevas funciones en la plataforma y consideraciones de migración
Junto con el lanzamiento del modelo, Anthropic introduce varias actualizaciones en su ecosistema:

– Control de esfuerzo más granular, con un nuevo nivel xhigh que permite equilibrar razonamiento y latencia en problemas complejos.

– Soporte para imágenes de mayor resolución y task budgets en la API, que permiten gestionar el gasto de tokens en ejecuciones largas.

– Funciones ampliadas en Claude Code, como el comando /ultrareview para revisiones exhaustivas y la extensión del modo automático para usuarios Max.

La empresa advierte que Opus 4.7 utiliza un tokenizador actualizado, lo que puede aumentar el número de tokens generados a partir de un mismo texto. Además, el modelo tiende a producir más tokens en niveles de esfuerzo altos debido a su razonamiento extendido. Anthropic recomienda medir el impacto en cargas reales y ofrece una guía de migración para facilitar la transición desde Opus 4.6.

Disponibilidad y precios
Claude Opus 4.7 está disponible en todos los productos de Claude, así como en la API y en plataformas asociadas como Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry. Los precios se mantienen sin cambios respecto a la versión anterior: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.

Fuente: Anthropic | Editado por CDOL

Custom Text
Artículo anteriorCore Series 3: la apuesta de Intel para renovar equipos domésticos y educativos