OpenAI avanza hacia agentes de desarrollo más autónomos con GPT‑5.3‑Codex‑Spark

El modelo complementa a las versiones de largo plazo y abre la puerta a sistemas híbridos que combinan razonamiento profundo con interacción inmediata.

Por

Prensa CambioDigital OnLine

13 febrero 2026

OpenAI presentó GPT‑5.3‑Codex‑Spark, un modelo diseñado para ofrecer una experiencia de programación en tiempo real con una velocidad de respuesta que busca acercarse a la inmediatez. La compañía lo describe como una versión más pequeña y optimizada de GPT‑5.3‑Codex, pensada para tareas interactivas en las que la latencia influye tanto como la capacidad del modelo. La iniciativa marca el primer hito de la colaboración entre OpenAI y Cerebras, anunciada en enero, cuyo objetivo es explorar nuevas formas de servir modelos de IA en hardware especializado para reducir los tiempos de espera en ciclos de desarrollo.

Codex‑Spark se presenta inicialmente como una vista previa de investigación disponible para usuarios de ChatGPT Pro dentro de la aplicación Codex, la interfaz de línea de comandos y la extensión para Visual Studio Code. El modelo funciona sobre el Wafer Scale Engine 3 de Cerebras, un acelerador diseñado para inferencia de baja latencia que permite superar los 1.000 tokens por segundo en condiciones óptimas. OpenAI sostiene que esta capacidad abre la puerta a patrones de interacción distintos, en los que el desarrollador puede interrumpir, redirigir o ajustar el trabajo del modelo mientras este genera código, sin depender de ciclos de espera prolongados.

La compañía explica que, aunque la velocidad del modelo es un factor clave, la reducción de latencia en todo el recorrido de la solicitud es igual de determinante. Para ello, OpenAI reescribió partes de su infraestructura de inferencia, optimizó el flujo de datos entre cliente y servidor y adoptó conexiones WebSocket persistentes. Según la información publicada, estas mejoras reducen en un 80% la sobrecarga por ida y vuelta entre cliente y servidor, disminuyen en un 30% la latencia por token y acortan a la mitad el tiempo hasta la aparición del primer token visible. Estas optimizaciones beneficiarán a otros modelos de la plataforma a medida que se integren en la infraestructura general.

Codex‑Spark mantiene un estilo de trabajo ligero por defecto: realiza ediciones puntuales, evita ejecutar pruebas automáticamente y prioriza la rapidez en la iteración. Está orientado a tareas como ajustar lógica, modificar interfaces o realizar cambios localizados en proyectos existentes. Con una ventana de contexto de 128.000 tokens y funcionamiento exclusivamente textual, el modelo busca complementar a las versiones más grandes de Codex, que están pensadas para tareas prolongadas que pueden requerir horas o días de ejecución autónoma.

OpenAI señala que el modelo ha sido evaluado en benchmarks como SWE‑Bench Pro y Terminal‑Bench 2.0, centrados en capacidades de ingeniería de software agentica. Aunque Codex‑Spark no alcanza el rendimiento de los modelos más grandes, completa las tareas en una fracción del tiempo gracias a su velocidad de inferencia. La compañía también aclara que el modelo incorpora el mismo entrenamiento de seguridad que la línea principal de GPT‑5.3 y que, según sus evaluaciones internas, no presenta riesgos que superen los umbrales establecidos en su Preparedness Framework para áreas sensibles como ciberseguridad o biología.

Durante la fase de vista previa, Codex‑Spark tendrá límites de uso independientes debido a que opera sobre hardware especializado. OpenAI anticipa que la disponibilidad puede variar en momentos de alta demanda mientras se amplía la capacidad del centro de datos y se ajusta la experiencia de usuario. Además de los usuarios de ChatGPT Pro, un grupo reducido de socios de diseño tendrá acceso al modelo a través de la API para explorar integraciones en productos propios.

La compañía plantea que Codex evolucionará hacia un sistema con dos modos complementarios: uno orientado a razonamiento y ejecución de largo plazo, y otro centrado en colaboración inmediata. Con el tiempo, ambos modos podrían integrarse para permitir que el modelo mantenga un ciclo de interacción estrecho con el usuario mientras delega tareas extensas a subagentes o distribuye trabajo en paralelo. OpenAI sostiene que, a medida que los modelos aumentan su capacidad, la velocidad de interacción se convierte en un factor limitante, y que la inferencia ultrarrápida puede ampliar lo que es posible para quienes transforman ideas en software funcional.

Fuente: nota de prensa OpenAI | Editado por CDOL

ESET Security Days 2026 Venezuela: El rol de la inteligencia de…

82% de las empresas en Venezuela sufren fallas graves de seguridad,…

La ciberseguridad como motor financiero: El nuevo lenguaje para los tomadores…

Digitel y Simple sellan una alianza estratégica para transformar el entretenimiento…

Activista estadounidense lanza un mapa colaborativo para vigilar el impacto de…

Broadcom amplía su estrategia para el borde inteligente con su primer…

Samsung y Google presentan nuevas gafas inteligentes en colaboración con marcas…

Las ventas de monitores para computadora crecen impulsadas por el sector…

Bluesky desafía el modelo cerrado de X, artículos y publicaciones largas…

Meta lanza suscripciones globales y prepara Meta One: la apuesta por…

La Linux Foundation impulsa un estándar para localizar agentes de IA…

YouTube introduce la detección automática de IA para identificar contenidos modificados

Mercado smartphones en América Latina crece 3% y llega a 34.8…

Qualcomm amplía su oferta móvil con Snapdragon 6 Gen 5 y…

OpenAI adelanta el lanzamiento de su primer smartphone para el próximo…

Envíos de smartphones crecen 1% en el 1T26, pero el futuro…

Casi 7 de cada 10 empresas están dispuestas a pagar por…

Falla en el sistema que hace comunicar a los agentes de…

Falsa página de Claude AI distribuye malware mediante anuncios y SEO…

Los peligros detrás del trend de IA que ubica a los…

Red Hat actualiza su plataforma empresarial con capacidades poscuánticas y mejoras…

Apple soluciona el fallo que permitía leer mensajes eliminados en el…

Apple unifica sus servicios empresariales en una nueva plataforma

SUSE incorpora IA y virtualización avanzada para unificar la gestión de…

OpenAI avanza hacia agentes de desarrollo más autónomos con GPT‑5.3‑Codex‑Spark

OTROS ARTÍCULOS RELACIONADOS

La nueva versión de Claude Opus 4.8 profundiza en fiabilidad y...

La guerra de la IA: Anthropic vale US$ 965.000 millones y...

Los agentes conversacionales llegan al comercio minorista con la propuesta de...

El mercado de las fábricas de IA entra en su era...

Google amplía su arquitectura para agentes

Reconocido economista estadounidense asegura que una IA comunitaria y la juventud,...

La Claude Compliance API gana presencia en entornos corporativos diversos

¡SÍGUENOS EN LAS REDES SOCIALES!

NOTICIAS MÁS VISTAS

macOS Catalina: ¿qué hacer con las aplicaciones de 32 bits?

Inter comienza 2021 con nuevos planes de servicio

Historia de Android: todas las versiones desde la 1.0 hasta Android...

CATEGORÍAS MÁS CONSULTADAS

ESET Security Days 2026 Venezuela: El rol de la inteligencia de...