La empresa matriz de Tik Tok, ByteDance, ha presentado OmniHuman, un modelo de inteligencia artificial capaz de transformar fotos estáticas en videos fluidos. La diferencia con otros programas actualmente en circulación es, según la empresa, la capacidad de animar todo el contenido de una foto y no sólo las caras de las personas que aparecen en la imagen. Un modus operandi similar al mostrado hasta ahora por la IA Sora de OpenAI, que sigue siendo un proyecto experimental, dedicado a profesionales y aún cerrado.
No está claro si ByteDance pondrá OmniHuman a disposición de los usuarios pero, dado el público al que va dirigido, es posible que se convierta en una opción de pago de la plataforma social de Tik Tok en su lanzamiento.
«OmniHuman mejora significativamente la reproducción de gestos», se lee en el sitio de referencia del proyecto, “un verdadero desafío para los métodos existentes, y produce resultados altamente realistas”.
El modelo se entrenó con más de 18.700 horas de video de distintas fuentes. «Observamos dibujos animados, objetos artificiales, animales y poses desafiantes», prosiguen los desarrolladores, “para asegurarnos de que las características del movimiento coinciden con las características únicas de cada estilo”. Si los resultados realistas plantean el riesgo de la difusión de contenidos hoax, los llamados deepfakes, ByteDance anticipó los usos previstos de OmniHuman, desde avatares que prestan asistencia a empresas y marcas hasta videojuegos, donde sería más fácil crear personajes con animaciones realistas y mejores resultados. Pero también la educación.
Uno de los ejemplos proporcionados por ByteDance muestra una imagen de Albert Einstein que cobra vida frente a una pizarra durante una clase de física.
https://www.youtube.com/watch?v=4GRyt0GIcl4&t=2s
Fuente: ByteDance








































