Google lanza Imagen 3 en Gemini con mejoras significativas tras las críticas a la versión anterior

Google ha añadido dos nuevas funciones a Gemini: la creación de Gemini Gems e Imagen 3, que se implementarán de forma escalonada, empezando por los suscriptores de Gemini Advanced.

0
6

Google ha anunciado recientemente que Gemini podrá volver a crear imágenes con Imagen 3. Tras interrumpir esta función a principios de año, el gigante tecnológico permite ahora a los usuarios utilizar modelos de IA para generar imágenes. Pero, como se ha dicho, no es la primera vez que Gemini de Google cuenta con tales poderes. La versión anterior de Imagen, la herramienta utilizada por Gemini para crear imágenes de IA, se enfrentó a varias reacciones negativas, lo que llevó a la empresa a dar marcha atrás.

En febrero, Google fue objeto de escrutinio por su herramienta de generación de imágenes. Las pruebas sugieren que la herramienta era muy tendenciosa y representaba escenas históricas inexactas. Por ejemplo, representaciones raciales incorrectas y más. Tras tales quejas, Google decidió dar un paso atrás y trabajar en los problemas.

Y ahora, seis meses después, Google está listo para rodar con una versión mejorada de la herramienta de generación de imágenes, Imagen 3. Veamos en qué se diferencia.

Imagen 3 de Gemini: una herramienta de generación de imágenes mejorada
En la entrada del blog de Google, el director senior de Gemini, Dave Citron, afirma que la empresa ha mejorado las capacidades creativas de generación de imágenes. Imagen 3 se pondrá a disposición de todos los usuarios en los próximos días. No sólo ha mejorado la función creativa, sino que también ha ampliado su disponibilidad para los usuarios en todos los idiomas.

Según Google, «Imagen 3 establece un nuevo estándar de calidad de imagen, generando imágenes con unas pocas palabras.»

También afirmó que la empresa había hecho «progresos significativos» en la generación de representaciones de personas a través de Imagen 3.

«Hemos trabajado para introducir mejoras técnicas en el producto, así como conjuntos de evaluación mejorados, ejercicios de red-teaming y principios de producto claros», escribió Citron. Los ejercicios de Red Teaming consisten en probar un producto simulando situaciones reales para identificar posibles vulnerabilidades antes de que se haga público. La entrada del blog añadía que habrá imperfecciones en el área creativa de Imagen 3. Pero Google está dispuesto a escuchar a los usuarios y obtener sus comentarios para mejorar la función.

Citron dijo que los usuarios no podrán crear imágenes fotorrealistas, individuos identificables, representaciones de menores o «escenas excesivamente sangrientas, violentas o sexuales». Google llevará gradualmente la función a más usuarios, añadió.

Crear gemas: Nuevos expertos en Géminis
Imagen 3 no es la única novedad añadida por Google. En los próximos días, los suscriptores de Gemini Advanced, Business y Enterprise podrán empezar a crear y chatear con Gems, la versión personalizada de Gemini que se presentó por primera vez en primicia en I/O. Con esta función, los usuarios pueden personalizar las Gems para actuar como expertos en temas o refinarlas para sus objetivos específicos.

En palabras de Google: «Con las Gemas, puede crear un equipo de expertos que le ayuden a pensar en un proyecto difícil, a aportar ideas para un próximo evento o a escribir el pie de foto perfecto para un post en las redes sociales. Su Gems también puede recordar un conjunto detallado de instrucciones para ayudarle a ahorrar tiempo en tareas tediosas, repetitivas o difíciles.»

Las Gems se están desplegando ahora en ordenadores de sobremesa y dispositivos móviles para los usuarios de Gemini Advanced, Gemini Business y Gemini Enterprise en más de 150 países y en la mayoría de los idiomas.

Fuente WEB | Editado por CambioDigital Online

Custom Text
Artículo anteriorMeta anuncia que Threads da otro paso hacia el fediverso
Artículo siguienteDigitel: Comprometida con las telecomunicaciones de Venezuela