Google presenta AudioPaLM, nuevo modelo lingüístico capaz de traducir textos con la voz AI

Por

26 junio 2023

AudioPaLM es una arquitectura multimodal que combina las ventajas de dos modelos ya existentes: PaLM-2 y AudioLM y puede manejar y producir texto y voz.
om.gupta Publicado: 26 de junio de 2023 11:24 AM IST

Últimamente se han producido muchos avances y desarrollos en el campo de los grandes modelos lingüísticos (LLM). Estos modelos son un tipo de red neuronal artificial que tiene muchos parámetros y se entrena con una gran cantidad de datos de texto mediante aprendizaje autosupervisado o aprendizaje semisupervisado. Leer también – Alphabet, matriz de Google, y Airtel apuestan por el láser para llevar Internet a zonas remotas

Estos grandes modelos lingüísticos impulsan nuevas herramientas de IA generativa como Google Bard y ChatGPT de OpenAI. Recientemente, los investigadores de Google han dado a conocer un nuevo modelo lingüístico llamado AudioPaLM, capaz de escuchar, hablar y traducir. Lee también – Android hacks: Cómo transferir contactos de un teléfono a otro

AudioPaLM es una arquitectura multimodal que combina las ventajas de dos modelos ya existentes: PaLM-2 y AudioLM. El sistema puede manejar y producir texto y voz y puede aplicarse para el reconocimiento de voz o para crear traducciones con voces originales. Lea también – YouTube planea expandirse a los juegos en línea con «Playables»: Informe

PaLM-2 es un modelo lingüístico basado en texto que es capaz de comprender conocimientos lingüísticos específicos de un texto. AudioLM es experto en retener información paralingüística como la identidad y el tono del hablante.

Al combinar estos dos modelos, AudioPaLM utiliza la capacidad lingüística de PaLM-2 y la conservación de información paralingüística de AudioLM, lo que da como resultado una comprensión y generación más profundas tanto del texto como del habla.

Además, el modelo puede realizar traducciones de voz a texto en muchos idiomas, incluso para combinaciones de voz que no haya visto durante el entrenamiento. Esta capacidad puede ser útil para aplicaciones reales, como la comunicación multilingüe en tiempo real.

AudioPaLM también puede transferir voces de un idioma a otro a partir de breves instrucciones habladas, así como capturar y reproducir voces distintas en diferentes idiomas.

AudioPaLM ha obtenido los mejores resultados en pruebas de traducción de voz y ha demostrado un rendimiento competitivo en tareas de reconocimiento de voz.

Filtro Perspective de Google Search
Google anunció un nuevo filtro para la Búsqueda de Google conocido como «Perspectivas» en su conferencia anual de desarrolladores, Google I/O 2023, el mes pasado. Ahora, casi un mes y medio después, la compañía ha comenzado a desplegar el nuevo filtro Perspectives a todos los usuarios de la Búsqueda de Google en todo el mundo.

Google ha hecho el anuncio a través de una publicación en sus redes sociales. «El mes pasado en #GoogleIO compartimos las actualizaciones que estamos haciendo a la Búsqueda para ayudarte a encontrar y explorar diversas perspectivas de expertos y gente común. Hoy podrás probarlas», escribió la empresa en un mensaje en su cuenta oficial de Twitter.

El nuevo filtro Perspectives de Google Search aporta un aspecto humano a los resultados de búsqueda. En la actualidad, los resultados de búsqueda que los usuarios ven en la plataforma se ven afectados por el algoritmo de la empresa basado en varios factores como fechas, autores, valoraciones y proximidad, entre otros. Ahora, la nueva función Perspectivas cambia esa situación al incorporar opiniones y sugerencias de seres humanos reales.

Fuente WEB | Editado por CambioDigital OnLine

Asociación Bancaria de Venezuela promueve informe de la ONCDOFT sobre prevención…

Casi uno de cada seis puntos de WiFi público es inseguro…

Mercantil conmemora el Día Mundial del Ambiente con acciones sostenibles de…

CANTV capacita a más de 4.600 integrantes de mesas técnicas de…

La demanda de pantallas OLED para notebooks alcanzará los US$ 11.500…

RTX Spark marca la entrada de NVIDIA en el mercado de…

Majorana 2 marca un nuevo capítulo en la apuesta cuántica de…

Activista estadounidense lanza un mapa colaborativo para vigilar el impacto de…

Meta extiende a Facebook y Messenger la protección para menores

Las suscripciones de video en línea alcanzaron las 2.240 millones en…

Bluesky desafía el modelo cerrado de X, artículos y publicaciones largas…

Meta lanza suscripciones globales y prepara Meta One: la apuesta por…

Mercado smartphones en América Latina crece 3% y llega a 34.8…

Qualcomm amplía su oferta móvil con Snapdragon 6 Gen 5 y…

OpenAI adelanta el lanzamiento de su primer smartphone para el próximo…

Envíos de smartphones crecen 1% en el 1T26, pero el futuro…

Del caos en la cancha al control en la estrategia: cómo…

Akamai y GM Sectec se asocian para proteger la fuerza laboral…

Alerta por fraudes cibernéticos ante la proximidad del Mundial de Fútbol…

El Mundial de Fútbol en la mira de los piratas informáticos…

Red Hat actualiza su plataforma empresarial con capacidades poscuánticas y mejoras…

Apple soluciona el fallo que permitía leer mensajes eliminados en el…

Apple unifica sus servicios empresariales en una nueva plataforma

SUSE incorpora IA y virtualización avanzada para unificar la gestión de…

Google presenta AudioPaLM, nuevo modelo lingüístico capaz de traducir textos con la voz AI

OTROS ARTÍCULOS RELACIONADOS

Un lanzamiento que desplaza la inferencia desde la nube hacia el...

Microsoft busca liderar el ecosistema de la IA con el lanzamiento...

NVIDIA presenta Nemotron 3 Ultra un modelo que impulsa el rendimiento,...

Declaración de autonomía: Microsoft presenta la familia MAI y redefine su...

Anthropic expande el proyecto Mythos para la ciberseguridad en quince países

El salto hacia la IA física: NVIDIA introduce la arquitectura Cosmos...

Microsoft introduce Web IQ dentro de su estrategia de agentes

¡SÍGUENOS EN LAS REDES SOCIALES!

NOTICIAS MÁS VISTAS

macOS Catalina: ¿qué hacer con las aplicaciones de 32 bits?

Inter comienza 2021 con nuevos planes de servicio

Historia de Android: todas las versiones desde la 1.0 hasta Android...

CATEGORÍAS MÁS CONSULTADAS

Amazon presenta la nueva generación de Proteus, el robot autónomo capaz...