La startup de IA OpenAI, respaldada por Microsoft, planea lanzar un nuevo agente de inteligencia artificial capaz de realizar tareas en un ordenador en nombre del usuario. Según un informe de Bloomberg, el agente de IA de OpenAI, cuyo nombre en código interno es «Operator», automatizará tareas como la escritura de código y la reserva de viajes. El objetivo de OpenAI es lanzar el agente de IA en enero de 2025 como un avance de investigación, accesible a través de su interfaz de programación de aplicaciones (API) para desarrolladores.
El informe sugiere que OpenAI ha estado trabajando en varios proyectos nuevos relacionados con agentes de IA. Sin embargo, el más próximo a su lanzamiento es una herramienta de propósito general capaz de automatizar tareas mediante un navegador web.
El consejero delegado de OpenAI, Sam Altman, insinuó recientemente el desarrollo de un nuevo agente de IA. En una sesión de «Ask Me Anything» en Reddit, Altman dijo: «Tendremos modelos cada vez mejores, pero creo que lo que se sentirá como el próximo gran avance serán los agentes.»
El mes pasado, The Information informó de que Google está trabajando en un gran modelo de acción también destinado a ejecutar tareas en la web en nombre de un usuario. Con el nombre en clave de «Proyecto Jarvis», la herramienta basada en IA se ejecuta en una futura versión del modelo Google Gemini y está específicamente diseñada para automatizar tareas web, sobre todo en Google Chrome.
Se dice que el agente de IA es capaz de interpretar capturas de pantalla, pulsar botones e introducir texto.
Los agentes de IA son herramientas de software potenciadas por IA que pueden realizar tareas de varios pasos para los usuarios con una supervisión mínima. Son sistemas de IA autónomos que pueden realizar tareas repetitivas que, de otro modo, requerirían trabajo manual. Además de procesar el lenguaje natural, un agente de IA puede tomar decisiones, resolver problemas e interactuar con el entorno para ejecutar acciones.
En esencia, los agentes de IA se basan en grandes modelos lingüísticos. Sin embargo, a diferencia de los chatbots de IA tradicionales, que basan sus respuestas en datos de entrenamiento, los agentes de IA almacenan interacciones pasadas en la memoria y planifican acciones futuras utilizando esta información actualizada.
Fuente WEB | Editado por CambioDigital OnLine