En las mismas horas en que Google ha dejado en suspenso la generación de imágenes de Gemini AI, por problemas con fotos históricas de personas, la startup Stability AI presenta Stable Diffusion 3.
Se trata de una de las herramientas de generación de foto a texto más populares de la red, pionera junto al chatbot ChatGpt en inteligencia artificial generativa para el consumidor.
Según un comunicado oficial del desarrollador, la principal diferencia entre Diffusion 3 y sus predecesores es la posibilidad que tienen los usuarios de insertar texto en las imágenes de forma clara y precisa, algo que no ocurre en otros sitios. No pocas veces, de hecho, al utilizar cualquier herramienta de IA generativa para fotos, en los gráficos resultantes los textos aparecen confusos, con faltas de ortografía y equívocos. Por el momento, Stable Diffusion 3 no se ha lanzado al público. La única forma de probarlo es apuntarse a la lista de espera y esperar a que salga la versión experimental.
Otras mejoras, para Stability AI, incluyen una mayor calidad de las imágenes finales y la oportunidad de describir con un texto más largo lo que se desea, así como incluir detalles en la petición para que éstos estén presentes en las imágenes artificiales.
El anuncio se produce pocos días después de que el mayor rival de Stability AI, OpenAI, presentara Sora, un modelo de inteligencia artificial capaz de generar vídeos de alta definición casi realistas a partir de simples instrucciones de texto. Sora aún no está disponible para el público en general.
Fuente: Web. Editado por CambioDigital OnLine