La división asiática de Microsoft ha presentado un nuevo proyecto de inteligencia artificial, llamado Vasa-1, que puede hacer videos de personas sólo a partir de sus fotos.
La plataforma, competidora de Sora, el software desarrollado por el creador de ChatGPT, OpenAI, también puede replicar la voz de un individuo, con sólo unos segundos de ejemplos muestreados. La intención es, para los investigadores, «allanar el camino para interacciones con avatares realistas que emulen el comportamiento humano». El resultado final abre nuevos interrogantes sobre la capacidad de distinguir un contenido generado por IA de uno real.
De momento, Vasa-1 es sólo un experimento en los laboratorios de Microsoft Research y no un programa diseñado para un uso generalizado. El gigante estadounidense ha publicado varios ejemplos en los que se ven rostros, a primera vista plausibles, pronunciando diversas frases. Aunque los movimientos de los labios y la cabeza puedan parecer artefactos, el riesgo potencial de utilizar la tecnología para difundir deepfakes, grabaciones falsas, es alto. Los propios investigadores son conscientes de ello y, por eso, han decidido no publicar «una demo, detalles del producto y su posterior implementación o cualquier oferta relacionada» hasta estar seguros de que su tecnología «se utilizará de forma responsable y de acuerdo con los procedimientos adecuados».
Según el documento de Microsoft, Vasa-1 se entrenó con el conjunto de datos VoxCeleb2, que contiene «más de un millón de expresiones de 6.112 personas famosas» extraídas de vídeos de YouTube. Aunque la herramienta se entrenó con rostros reales, Microsoft demuestra que Vasa-1 también puede funcionar con dibujos y obras de arte. Los expertos combinaron la Mona Lisa con un archivo de audio de la actriz Anne Hathaway. «Aun reconociendo la posibilidad de un uso indebido, los beneficios de la IA para vídeo van desde la equidad educativa a la mejora de la accesibilidad para personas con dificultades de comunicación, pasando por la compañía o el apoyo terapéutico para quienes lo necesitan», explica Microsoft.
Fuente: Microsoft