OpenAI introduce o3 y o4-mini: modelos diseñados para mejorar el análisis y la interpretación de datos

Los nuevos modelos, estan disponibles en ChatGPT para usuarios gratuitos y de pago

0
41

OpenAI ha anunciado recientemente la incorporación a su catálogo de dos nuevos modelos lingüísticos de gran escala: o3 y o4-mini. Estos desarrollos representan un avance notable en la capacidad de razonamiento de los sistemas conversacionales, marcando un hito en la evolución de ChatGPT. La característica distintiva de estos modelos radica en su entrenamiento para dedicar un tiempo considerable a la reflexión previa a la formulación de sus respuestas.

Por primera vez, se integran en estos modelos capacidades de razonamiento avanzadas con la autonomía para emplear y combinar todas las herramientas que ChatGPT pone a su disposición. Esto incluye la búsqueda en la web para la obtención de información actualizada, el análisis de archivos mediante la ejecución de código Python, la interpretación de entradas visuales y la generación de imágenes.

El proceso de entrenamiento ha dotado a o3 y o4-mini de la habilidad para discernir el momento y la manera óptimos para la utilización de estas herramientas. El objetivo es proporcionar respuestas detalladas y bien estructuradas en formatos diversos, abordando problemas complejos en un lapso de tiempo inferior a un minuto. Este progreso se orienta hacia la creación de un ChatGPT con mayor autonomía, capaz de llevar a cabo tareas de manera independiente para el usuario.

La sinergia entre un razonamiento sofisticado y el acceso irrestricto a un amplio abanico de herramientas ha permitido a estos modelos alcanzar un rendimiento significativamente superior en pruebas académicas y en la resolución de desafíos del mundo real. Con ello, se establece un nuevo estándar en términos de inteligencia y aplicabilidad práctica.

OpenAI o3: Ampliando las Fronteras del Razonamiento
El modelo o3 se posiciona como la cúspide de la capacidad de razonamiento desarrollada hasta el momento por OpenAI. Su desempeño sobresale en áreas tan diversas como la programación, las matemáticas, las ciencias, la percepción visual y otras disciplinas. Los resultados obtenidos en evaluaciones de referencia, como Codeforces, SWE-bench y MMMU, reflejan puntuaciones que marcan un nuevo liderazgo en el campo.

Este modelo demuestra una habilidad particular para abordar interrogantes complejos que demandan un análisis multifacético, especialmente en tareas relacionadas con la interpretación visual, como el análisis de imágenes, tablas y gráficos. La evaluación por parte de expertos ha revelado que o3 presenta un 20% menos de errores críticos en comparación con su predecesor, o1, al enfrentarse a tareas complejas del mundo real, particularmente en los ámbitos de la programación, la consultoría empresarial y la generación de ideas creativas.

Los primeros usuarios que han interactuado con o3 han destacado su rigor analítico como una valiosa herramienta para el pensamiento estructurado y su capacidad para generar y evaluar de manera crítica hipótesis novedosas, especialmente en contextos relacionados con la biología, las matemáticas y la ingeniería.

OpenAI o4-mini: Eficiencia y Rapidez en el Razonamiento
Por su parte, o4-mini se presenta como un modelo de menor tamaño, optimizado para ofrecer un razonamiento ágil y con una eficiencia de costes notable. A pesar de su menor escala, alcanza un rendimiento considerable en tareas matemáticas, de programación y visuales. Un dato relevante es su destacado desempeño en los exámenes AIME correspondientes a los años 2024 y 2025, donde se posiciona como el modelo con los mejores resultados.

Las evaluaciones realizadas por expertos indican que o4-mini supera a su predecesor, o3-mini, en tareas que no se enmarcan dentro de las áreas STEM (ciencia, tecnología, ingeniería y matemáticas) y en el campo de la ciencia de datos. Su eficiencia inherente permite establecer límites de uso más amplios en comparación con o3, lo que lo convierte en una opción adecuada para escenarios que requieren un alto volumen de consultas y un rendimiento significativo en el razonamiento.

Características Compartidas: Mejora en la Interacción y la Veracidad
Ambos modelos, o3 y o4-mini, exhiben una mayor precisión en el seguimiento de las instrucciones proporcionadas por el usuario. Además, ofrecen respuestas que resultan más útiles y verificables, gracias a la inteligencia mejorada y a la integración de fuentes de información provenientes de la web. Se anticipa que la interacción con estos modelos será más natural, ya que podrán referirse a intercambios previos para ofrecer respuestas más personalizadas y relevantes al contexto de la conversación.

Desarrollos Subyacentes y Capacidades Ampliadas
El escalado del aprendizaje por refuerzo durante el desarrollo de o3 ha revelado que un mayor procesamiento computacional se traduce en un mejor rendimiento, una tendencia que ya se había observado en el entrenamiento de los modelos GPT anteriores. Tanto o3 como o4-mini han sido entrenados para utilizar herramientas a través del aprendizaje por refuerzo, lo que les permite no solo saber cómo emplearlas, sino también cuándo es apropiado hacerlo.

Una novedad significativa es la capacidad de estos modelos para integrar directamente imágenes en su proceso de razonamiento. Esto abre la puerta a una nueva categoría de resolución de problemas que combina el análisis visual y textual de manera integrada.

Es importante destacar que o3 y o4-mini disponen de acceso completo a las herramientas nativas de ChatGPT y a herramientas personalizadas a través de solicitudes a su API de funcionalidades. El entrenamiento se ha enfocado en desarrollar su capacidad para razonar sobre la resolución de problemas y para determinar la estrategia óptima en la selección y el uso de las herramientas disponibles. El resultado esperado son respuestas detalladas y bien elaboradas en formatos de salida adecuados, que se generan de manera eficiente, generalmente en un tiempo inferior a un minuto.

Fuente OpenAI | Editado por CambioDigtial Online

Custom Text
Artículo anteriorAbside participa en el II Congreso Internacional de Ciberseguridad
Artículo siguienteSurveyMonkey inaugura su primera oficina latinoamericana en Costa Rica