El día que la IA supere a sus creadores

Los escenarios que plantea Anthropic sobre automatización, riesgos y gobernanza

0
15
Foto Anthropic

Durante décadas, la automejora recursiva (recursive self-improvement) fue un concepto reservado a la ciencia ficción y a debates teóricos. Hoy, gracias al uso intensivo de sistemas como Claude, está pasando del terreno especulativo a la realidad cotidiana de los laboratorios de vanguardia.

La evolución se mide, sobre todo, en la duración y complejidad de las tareas que los modelos pueden realizar sin supervisión estrecha. Hace apenas dos años, las capacidades autónomas se limitaban a flujos de trabajo de pocos minutos. En 2025 ya alcanzaban hora y media de ejecución continua, y las evaluaciones más recientes de 2026 muestran sistemas capaces de operar de forma fiable durante doce horas o más. Esta progresión, que duplica aproximadamente su horizonte temporal cada cuatro meses, se refleja también en benchmarks independientes. En SWE-bench, centrado en resolver errores reales en proyectos de código abierto, los modelos han pasado de tasas de éxito marginales a prácticamente saturar la prueba en solo dos años. Algo similar ocurre con CORE-bench, que evalúa la reproducción de investigaciones científicas: de un 20 % aproximado de éxito en 2024 a niveles cercanos a la saturación en poco más de un año.

Dentro de Anthropic, los números son aún más elocuentes. A mayo de 2026, más del 80 % del código que se integra en su base de código de producción es generado por Claude. Esto ha multiplicado la productividad: un ingeniero típico fusiona hoy alrededor de ocho veces más código por día que en 2024. No se trata solo de volumen. Los modelos han asumido tareas que antes parecían demasiado complejas para delegar: desde resolver en pocas horas vulnerabilidades que habrían requerido días o semanas de trabajo humano, hasta aplicar cientos de correcciones automatizadas que redujeron en un factor de mil ciertos errores críticos en una API. En experimentos de optimización de algoritmos de entrenamiento, los sistemas han logrado mejoras que superan con creces lo que un investigador humano experimentado suele conseguir en el mismo tipo de bucle.

Este avance no elimina el rol humano, sino que lo transforma. Según Anthropic, los modelos ya igualan o superan a ingenieros experimentados en la escritura de código funcional, mantenible y eficiente. El cuello de botella se desplaza entonces hacia lo que la compañía denomina “research taste” o criterio de investigación: la capacidad de identificar los problemas verdaderamente importantes, formular las hipótesis correctas, ejercer juicio estratégico y decidir la dirección general del trabajo. Esa ventaja humana persiste, aunque se estrecha progresivamente.

De cara al futuro, Anthropic esboza tres caminos posibles. El primero es el estancamiento, provocado por límites físicos, escasez de datos de calidad o restricciones severas de computación y energía. El segundo contempla una automatización cada vez mayor, pero todavía bajo control humano: los modelos aceleran drásticamente el progreso, mientras los investigadores mantienen la dirección estratégica. El tercero, más incierto y de mayor impacto, es la automejora recursiva plena: sistemas capaces de diseñar, entrenar y optimizar a sus propios sucesores de forma autónoma. En ese escenario, el ritmo de avance dejaría de depender principalmente del talento humano y pasaría a estar limitado por la disponibilidad de recursos computacionales, lo que podría reducir drásticamente los costos de desarrollo y, al mismo tiempo, elevar significativamente los riesgos de seguridad.

Ante este panorama, Anthropic defiende la necesidad de prepararse con anticipación. Si los riesgos de pérdida de control aumentaran, sería deseable contar con mecanismos verificables que permitan ralentizar temporalmente el desarrollo de los modelos más avanzados, dando tiempo a que las sociedades y sus instituciones se adapten. Sin embargo, advierten que una pausa unilateral por parte de un solo laboratorio o país sería contraproducente, ya que simplemente trasladaría el liderazgo a otros actores menos cautelosos. Por eso proponen explorar formas de coordinación internacional, inspiradas en los regímenes de control de armamento, aunque reconocen las enormes dificultades que plantea la naturaleza distribuida del software y los fuertes incentivos competitivos.

La IA ha empezado a intervenir de manera creciente en su propio ciclo de creación. Esta transición plantea desafíos que van mucho más allá del rendimiento técnico: afectará la economía, la ciencia, el empleo y la seguridad global. Anthropic insiste en que es urgente ampliar el debate público y fortalecer las capacidades institucionales antes de que la velocidad del avance tecnológico supere la capacidad de la sociedad para comprenderlo y gestionarlo de forma responsable.

Fuente: Anthropic | Editado por CDOL

Custom Text
Artículo anteriorCuando los racks de IA pasan del diseño a los despliegues reales