Nvidia presenta una IA que redefine la creación musical

0
30

El gigante tecnológico Nvidia ha presentado su último modelo de IA, que describe como «la máquina de sonido más flexible del mundo».

Fugatto, abreviatura de Foundational Generative Audio Transformer Opus 1, puede generar cualquier mezcla de música, voces o sonidos descritos con instrucciones utilizando una combinación de texto y archivos de audio, según la compañía.

El modelo se basa en el trabajo previo de Nvidia en torno al modelado del habla, la codificación de la voz y la comprensión del audio.

Según Nvidia, Fugatto ha sido creado por personas de todo el mundo, como India, Brasil, China, Jordania y Corea del Sur, lo que refuerza sus «capacidades multiacento y multilingües».

Rafael Valle, director de investigación de audio aplicado de Nvidia, explicó que la empresa quería crear un modelo que entendiera y generara sonidos como lo hacen los humanos.

«Fugatto es nuestro primer paso hacia un futuro en el que el aprendizaje multitarea no supervisado en síntesis y transformación de audio surja de la escala de datos y modelos», afirmó.

Nvidia también afirma que Fugatto permite a los usuarios crear paisajes sonoros «nunca vistos», lo que lo diferencia de otros modelos.

Sin embargo, es importante tomarse con cautela las afirmaciones de una empresa sobre sus propios modelos. A principios de este año, el Stanford AI Index afirmaba que «faltan seriamente» evaluaciones sólidas de los grandes modelos lingüísticos y que hay una falta de estandarización en los informes responsables sobre IA.

Y el año pasado, el Índice de Transparencia de Modelos Fundacionales creado por investigadores estadounidenses sugirió que las empresas del espacio de modelos fundacionales de IA son cada vez menos transparentes sobre sus creaciones.

Bajo escrutinio en más de un sentido
Nvidia ha estado invirtiendo fuertemente en el espacio de la IA, junto con muchos otros gigantes tecnológicos, y hasta ahora ha conseguido cosechar los beneficios. En mayo de 2023, se convirtió en el primer fabricante de chips en alcanzar una valoración de 1 billón de dólares y, en junio de este año, se convirtió en la empresa más valiosa del mundo.

Pero la empresa ha sido objeto de críticas por reprimir la competencia, tanto en el mercado de los chips como en el de la IA.

Y al margen de las investigaciones sobre competencia, el fabricante de chips de inteligencia artificial también ha sido objeto de críticas por utilizar supuestamente libros protegidos por derechos de autor para entrenar la inteligencia artificial, en un momento en el que se sigue cuestionando la amenaza de la inteligencia artificial para las industrias creativas.

El año pasado, miles de personas firmaron una carta escrita por el Gremio de Autores de Estados Unidos en la que se pedía a empresas como OpenAI, Alphabet y Meta que dejaran de utilizar sus obras para entrenar modelos de inteligencia artificial sin «consentimiento, reconocimiento o compensación».

A principios de este año, cientos de músicos -entre ellos Billie Eilish y Katy Perry- firmaron una carta abierta en la que pedían a los desarrolladores que dejaran de utilizar la IA para «devaluar los derechos de los artistas humanos».

Y en mayo, Sony escribió a más de 700 empresas tecnológicas pidiéndoles que se abstuvieran de utilizar sus contenidos para entrenar modelos de IA.

Fuente WEB | Editadopor CambioDigital Online

Custom Text
Artículo anteriorHPE innova en nube híbrida: gestión unificada, almacenamiento rápido y nubes privadas
Artículo siguientePróximamente: una función muy esperada en Threads