Una nueva etapa para Codex de OpenAI: del generador de código al asistente operativo

La aplicación incorpora interacción directa con el ordenador, gestión de tareas prolongadas y soporte visual.

0
4
Foto OpenAI

OpenAI presentó una nueva etapa en la evolución de Codex, su asistente orientado al desarrollo de software, con una actualización que amplía de forma notable el tipo de tareas que puede asumir y la manera en que se integra en el trabajo diario. La compañía describe este avance como una transición natural desde un modelo centrado en generar código hacia un sistema capaz de acompañar procesos completos, operar herramientas, mantener continuidad en proyectos y adaptarse a contextos que cambian con el tiempo. Según sus datos, más de tres millones de desarrolladores utilizan Codex cada semana, una cifra que refleja cómo el asistente ha ido ocupando un espacio estable en flujos de trabajo que antes dependían exclusivamente de herramientas tradicionales.

La novedad más visible es la capacidad del modelo para interactuar directamente con el ordenador del usuario. Codex puede ver la pantalla, mover un cursor propio, escribir, abrir aplicaciones y ejecutar acciones en programas que no ofrecen una API. Esta función permite automatizar tareas que suelen requerir intervención manual, como pruebas de interfaz, manipulación de herramientas locales o ajustes rápidos en entornos de desarrollo. La interacción no se limita a una única instancia: varios agentes pueden trabajar en paralelo sin interferir con la actividad del usuario, lo que abre la puerta a flujos de trabajo más distribuidos dentro de un mismo equipo.

La navegación web también se integra de forma más directa. La aplicación incorpora un navegador que permite señalar elementos de una página y dar instrucciones precisas al asistente, algo especialmente útil en desarrollo frontend o en la creación de prototipos interactivos. OpenAI anticipa que esta capacidad se ampliará para permitir un control más profundo del navegador, aunque por ahora se centra en tareas de diseño y pruebas.

La actualización incorpora además la posibilidad de generar e iterar imágenes mediante gpt-image-1.5, lo que facilita la creación de conceptos visuales, maquetas o elementos gráficos sin salir del entorno de trabajo. Esta integración combina capturas de pantalla, fragmentos de código y generación visual en un mismo espacio, algo que resulta útil en proyectos donde diseño y desarrollo avanzan en paralelo.

El ecosistema de plugins crece con más de noventa nuevas integraciones que permiten a Codex obtener contexto y ejecutar acciones en herramientas externas. Entre ellas se encuentran plataformas de colaboración, sistemas de despliegue, gestores de proyectos y servicios de datos como Atlassian Rovo, CircleCI, CodeRabbit, GitLab Issues, Microsoft 365, Neon de Databricks, Remotion, Render y Superpowers. La ampliación del catálogo refleja una tendencia general en la industria: los asistentes de IA se vuelven más útiles cuando pueden actuar dentro de los sistemas donde ocurre el trabajo real.

La aplicación incorpora funciones pensadas para acompañar el ciclo completo de desarrollo. Codex puede responder comentarios de revisión en GitHub, ejecutar varias pestañas de terminal, conectarse a entornos remotos mediante SSH en fase alfa y abrir archivos con vistas previas enriquecidas para documentos, hojas de cálculo, presentaciones o PDFs. Un panel de resumen permite ver los planes del agente, las fuentes utilizadas y los artefactos generados, lo que facilita seguir el hilo de trabajo sin necesidad de revisar cada paso.

OpenAI introduce también una versión preliminar de memoria que permite al asistente recordar preferencias, correcciones e información recopilada con esfuerzo. Esta capacidad busca reducir instrucciones repetitivas y mejorar la continuidad en tareas recurrentes. Combinada con los plugins y el contexto de proyectos, la memoria permite que Codex sugiera acciones útiles al inicio de la jornada o identifique puntos pendientes en documentos, conversaciones o bases de código. La compañía señala que algunos equipos ya utilizan estas funciones para mantener procesos activos durante días o semanas, especialmente en flujos de integración continua o gestión de incidencias distribuidas en herramientas como Slack, Gmail o Notion.

Las nuevas funciones comienzan a desplegarse en la aplicación de escritorio de Codex para usuarios que inician sesión con ChatGPT. La personalización basada en contexto y la memoria llegarán más adelante a clientes Enterprise, Edu y a usuarios de la Unión Europea y Reino Unido. El control del ordenador está disponible inicialmente en macOS, con una expansión prevista a otras regiones y sistemas.

OpenAI enmarca esta actualización dentro de su objetivo de reducir la distancia entre lo que las personas pueden imaginar y lo que pueden construir. La compañía anticipa que Codex seguirá ampliando su alcance en herramientas, flujos de trabajo y decisiones que forman parte del desarrollo de software, en un contexto donde los asistentes de IA se integran cada vez más en la infraestructura cotidiana de los equipos técnicos.

Fuente: OpenAI | Editado por CDOL

Custom Text
Artículo anteriorEmpresas en América Latina priorizan la creación de centros de operaciones de seguridad ante el aumento de ciberataques
Artículo siguienteAdobe Firefly evoluciona hacia un estudio creativo unificado