Google DeepMind ha anunciado el desarrollo de CodeMender, un agente autónomo basado en inteligencia artificial diseñado para mejorar la seguridad del código de manera automática. Este avance se enmarca en los esfuerzos de la compañía por aplicar modelos de lenguaje avanzados a tareas críticas de ingeniería de software, especialmente en la detección y corrección de vulnerabilidades que tradicionalmente han requerido intervención humana especializada.
CodeMender combina capacidades reactivas y proactivas. Por un lado, puede identificar y parchear vulnerabilidades nuevas en tiempo real; por otro, es capaz de reescribir fragmentos de código existentes para eliminar clases enteras de fallos potenciales. En los seis meses de desarrollo inicial, el sistema ha generado y enviado más de 70 correcciones de seguridad a proyectos de código abierto, incluyendo algunos con bases de código que superan los 4 millones de líneas.
El agente opera sobre la base de los modelos Gemini Deep Think, que le permiten razonar sobre el comportamiento del software antes de aplicar cambios. Para garantizar la fiabilidad de sus intervenciones, CodeMender incorpora un sistema de validación automática que evalúa si los parches propuestos resuelven el problema raíz, mantienen la funcionalidad original, evitan regresiones y respetan las convenciones de estilo del proyecto. Solo las correcciones que cumplen con estos criterios son presentadas para revisión humana antes de ser integradas.
Entre las herramientas que respaldan a CodeMender se encuentran técnicas de análisis estático y dinámico, pruebas diferenciales, fuzzing y solvers SMT. Estas metodologías permiten al agente examinar patrones de código, flujos de control y estructuras de datos para identificar debilidades arquitectónicas. Además, DeepMind ha desarrollado sistemas multiagente que abordan aspectos específicos del proceso de corrección, como herramientas de crítica que comparan el código original con el modificado y ajustan los cambios si se detectan errores.
Un ejemplo destacado del funcionamiento de CodeMender incluye la corrección de un desbordamiento de búfer en una biblioteca de compresión de imágenes ampliamente utilizada, libwebp. En este caso, el agente aplicó anotaciones de seguridad (-fbounds-safety) que instruyen al compilador para añadir verificaciones de límites, lo que previene la explotación de vulnerabilidades similares en el futuro. Cabe recordar que libwebp fue objeto de un exploit de tipo “zero-click” en iOS en 2023, lo que subraya la relevancia de este tipo de intervenciones.
Otra capacidad notable del sistema es su habilidad para recuperarse de errores que surgen como resultado de sus propias modificaciones. Si una anotación genera fallos de compilación o pruebas, el agente puede identificar la causa y corregirla de forma autónoma, utilizando herramientas de evaluación funcional basadas en modelos de lenguaje.
Aunque los resultados iniciales son prometedores, DeepMind ha adoptado un enfoque prudente. Todas las correcciones generadas por CodeMender son revisadas por investigadores antes de ser enviadas a los mantenedores de los proyectos. La compañía planea ampliar gradualmente el uso del agente en proyectos críticos de código abierto, y tiene previsto publicar los resultados técnicos en informes y artículos especializados.
Con CodeMender, DeepMind explora el potencial de la inteligencia artificial no solo como herramienta de asistencia, sino como agente activo en la mejora estructural de la seguridad del software. Este enfoque podría representar un cambio significativo en la forma en que se gestionan las vulnerabilidades en sistemas complejos, especialmente en un contexto donde la escala y la velocidad de desarrollo superan la capacidad humana de revisión manual.
Fuente: nota de prensa Google | Editado por CDOL









































