Google lanza Imagen 3 en Gemini con mejoras significativas tras las críticas a la versión anterior

Google ha añadido dos nuevas funciones a Gemini: la creación de Gemini Gems e Imagen 3, que se implementarán de forma escalonada, empezando por los suscriptores de Gemini Advanced.

Por

Prensa CambioDigital OnLine

29 agosto 2024

Google ha anunciado recientemente que Gemini podrá volver a crear imágenes con Imagen 3. Tras interrumpir esta función a principios de año, el gigante tecnológico permite ahora a los usuarios utilizar modelos de IA para generar imágenes. Pero, como se ha dicho, no es la primera vez que Gemini de Google cuenta con tales poderes. La versión anterior de Imagen, la herramienta utilizada por Gemini para crear imágenes de IA, se enfrentó a varias reacciones negativas, lo que llevó a la empresa a dar marcha atrás.

En febrero, Google fue objeto de escrutinio por su herramienta de generación de imágenes. Las pruebas sugieren que la herramienta era muy tendenciosa y representaba escenas históricas inexactas. Por ejemplo, representaciones raciales incorrectas y más. Tras tales quejas, Google decidió dar un paso atrás y trabajar en los problemas.

Y ahora, seis meses después, Google está listo para rodar con una versión mejorada de la herramienta de generación de imágenes, Imagen 3. Veamos en qué se diferencia.

Imagen 3 de Gemini: una herramienta de generación de imágenes mejorada
En la entrada del blog de Google, el director senior de Gemini, Dave Citron, afirma que la empresa ha mejorado las capacidades creativas de generación de imágenes. Imagen 3 se pondrá a disposición de todos los usuarios en los próximos días. No sólo ha mejorado la función creativa, sino que también ha ampliado su disponibilidad para los usuarios en todos los idiomas.

Según Google, «Imagen 3 establece un nuevo estándar de calidad de imagen, generando imágenes con unas pocas palabras.»

También afirmó que la empresa había hecho «progresos significativos» en la generación de representaciones de personas a través de Imagen 3.

«Hemos trabajado para introducir mejoras técnicas en el producto, así como conjuntos de evaluación mejorados, ejercicios de red-teaming y principios de producto claros», escribió Citron. Los ejercicios de Red Teaming consisten en probar un producto simulando situaciones reales para identificar posibles vulnerabilidades antes de que se haga público. La entrada del blog añadía que habrá imperfecciones en el área creativa de Imagen 3. Pero Google está dispuesto a escuchar a los usuarios y obtener sus comentarios para mejorar la función.

Citron dijo que los usuarios no podrán crear imágenes fotorrealistas, individuos identificables, representaciones de menores o «escenas excesivamente sangrientas, violentas o sexuales». Google llevará gradualmente la función a más usuarios, añadió.

Crear gemas: Nuevos expertos en Géminis
Imagen 3 no es la única novedad añadida por Google. En los próximos días, los suscriptores de Gemini Advanced, Business y Enterprise podrán empezar a crear y chatear con Gems, la versión personalizada de Gemini que se presentó por primera vez en primicia en I/O. Con esta función, los usuarios pueden personalizar las Gems para actuar como expertos en temas o refinarlas para sus objetivos específicos.

En palabras de Google: «Con las Gemas, puede crear un equipo de expertos que le ayuden a pensar en un proyecto difícil, a aportar ideas para un próximo evento o a escribir el pie de foto perfecto para un post en las redes sociales. Su Gems también puede recordar un conjunto detallado de instrucciones para ayudarle a ahorrar tiempo en tareas tediosas, repetitivas o difíciles.»

Las Gems se están desplegando ahora en ordenadores de sobremesa y dispositivos móviles para los usuarios de Gemini Advanced, Gemini Business y Gemini Enterprise en más de 150 países y en la mayoría de los idiomas.

Fuente WEB | Editado por CambioDigital Online

Wawa habilita la plataforma digital ayuda.enwawa.com para movilizar el apoyo ante…

El responsable de los Vision Pro de Apple listo para pasar…

Asociación Bancaria alerta sobre falsos canales de recaudación y ofrece pautas…

Activo Banca Universal ofrece su plataforma para atender la emergencia

Qualcomm redefine su estrategia para centros de datos en la era…

IBM introduce la arquitectura “nanostack” y abre una nueva etapa en…

La industria de semiconductores entra en una fase de integración más…

Proveedores de chips de Japón sufren caída histórica de ventas en…

Las redes sociales se llenan de rostros creados por IA que…

Del hype al portafolio: Cinco formas como Wall Street está redefiniendo…

Kunal Shah asume la dirección global de WhatsApp tras la salida…

IA en la oficina: Zoom busca cerrar la brecha entre reuniones…

Detrás de cada gol existe una red que millones de personas…

El smartphone global alcanzará un precio promedio histórico de US$565 en…

Más de 3.000 millones de suscripciones 5G y el tráfico de…

Android 17 avanza hacia un sistema más contextual

IBM, Red Hat y Palo Alto Networks amplían Lightwell para acelerar…

Microsoft neutraliza herramientas de cibercrimen que infectaron a miles de PCs…

Meta suspende un programa de monitoreo interno tras una filtración de…

Bots maliciosos, casi tan numerosos como compradores reales

Red Hat actualiza su plataforma empresarial con capacidades poscuánticas y mejoras…

Apple soluciona el fallo que permitía leer mensajes eliminados en el…

Apple unifica sus servicios empresariales en una nueva plataforma

SUSE incorpora IA y virtualización avanzada para unificar la gestión de…

Google lanza Imagen 3 en Gemini con mejoras significativas tras las críticas a la versión anterior

OTROS ARTÍCULOS RELACIONADOS

Razonamiento, seguridad y estabilidad: las claves del avance de GPT‑5.6

La IA en desarrollo de software abre oportunidades, pero también costos...

IBM, Red Hat y Palo Alto Networks amplían Lightwell para acelerar...

Las herramientas de IA proporcionan nuevas formas de comprender la intención...

Detección de miles de ciberataques ocultos tras herramientas de IA de...

Los riesgos de la IA cognitiva van más allá de la...

Jalapeño y la nueva arquitectura de la IA generativa

¡SÍGUENOS EN LAS REDES SOCIALES!

NOTICIAS MÁS VISTAS

macOS Catalina: ¿qué hacer con las aplicaciones de 32 bits?

Inter comienza 2021 con nuevos planes de servicio

Historia de Android: todas las versiones desde la 1.0 hasta Android...

CATEGORÍAS MÁS CONSULTADAS

Razonamiento, seguridad y estabilidad: las claves del avance de GPT‑5.6