El PNL está a punto de revolucionar la industria

0
26

Las mejoras recientes en el procesamiento del lenguaje natural (PNL, por sus siglas en inglés) están reforzando las tecnologías populares con capacidades de voz y texto, ya se trate de leer correos electrónicos en voz alta con voz natural o Excel, lo que le permite escribir preguntas sobre los datos de su hoja de cálculo y obtener respuestas en forma de gráficos y tablas dinámicas generados automáticamente.

A medida que el PNL se vuelve más preciso y está más disponible, podría pasar de manejar chatbots de atención al cliente en temas preestablecidos a manejar datos cualitativos, parcialmente estructurados y no estructurados. Finalmente, cumplir con la promesa de la minería del conocimiento, podría ofrecer información sobre los procesos, activos y responsabilidades de la empresa para crear mejores flujos de trabajo y una visión más en tiempo real de la organización.

«El PNL divide las palabras en su forma más simple e identifica patrones, reglas y relaciones entre ellas”, explica Walt Kristick, vicepresidente sénior de Tecnología Aplicada y Avanzada de Apexanalytix. «Utiliza algoritmos informáticos para analizar e interpretar el lenguaje natural escrito y hablado con el fin de permitir que los sistemas aprendan y entiendan los idiomas humanos”.

El PNL utiliza técnicas que van desde la traducción y la generación de lenguaje (para resúmenes, anotaciones o incluso explicando otros modelos de aprendizaje automático), hasta la clasificación y agrupamiento, análisis de sentimientos y otras formas de extracción de información. Kristick señala que las formas más simples de PNL ya se usan generalizadamente en revisión ortográfica, sugerencias de correo electrónico y respuestas de mensajería. Los asistentes virtuales como Siri usan PNL, al igual que los chatbots.

«Existe una creciente demanda por la capacidad de analizar y extraer el significado de un texto y de fuentes de datos no relacionados, especialmente en los mercados de la salud y las ciencias de la vida”, señala Kristick.

A continuación, un vistazo al estado actual del PNL y dónde podría encajar en su organización.

Predominan los servicios de PNL
Si bien existen muchos algoritmos para crear sus propias tareas de PNL, junto con marcos como Python NLTK, Sanford CoreNLP y Apache OpenNLP, los modelos más efectivos son extremadamente grandes. Al momento de escribir este artículo, el modelo de generación de lenguaje natural Turing de Microsoft, que tiene 17 mil millones de parámetros, era el más grande jamás publicado, y BERT y GPT-2 también tienen miles de millones de parámetros.

«Simplemente sacar estos modelos del estante no funciona para algunas de las cosas sofisticadas que las empresas deben hacer”, advierte Lili Cheng, vicepresidenta corporativa de inteligencia artificial conversacional de Microsoft. «Para muchas empresas, sería muy difícil albergar estos grandes modelos y administrarlos y hacer todo ese trabajo. Algunas personas quieren hacer eso, pero creemos que muchos más clientes solo querrán personalizar y agregar su propia información”, afirma Cheng, y señala que para muchas organizaciones contratar expertos en PNL es un desafío.

Incluso en las organizaciones con experiencia interna en inteligencia artificial, a menudo se recurre a los servicios de PNL de proveedores como Microsoft, Amazon, Google e IBM, para que los desarrolladores expertos y los usuarios empresariales también aprovechen la tecnología.

Telefónica, cliente de Microsoft que tiene su propio grupo de inteligencia artificial, está utilizando la plataforma Power de Microsoft para crear sus propias herramientas -con servicios como Q&A Maker- para los usuarios de negocio sin experiencia en desarrollo. «Apunta a un archivo PDF o a una página web de preguntas frecuentes, y crea la base de conocimiento a partir de todas estas fuentes para permitir que las personas hagan preguntas y respuestas, ya sea para buscar o para tener una experiencia conversacional”, afirma Cheng.

Aquí, los chatbots son uno de los principales usos del PNL. Los chatbots pueden tomar pedidos, proporcionar respuestas a las preguntas frecuentes, absolver consultas sobre rutas, reservar reuniones y transmitir conversaciones a humanos cuando sea necesario. El PNL también es una poderosa herramienta para conseguir información de los clientes sobre el creciente volumen de datos de texto y voz que las compañías ya tienen, afirma Paul Quinn, director senior de Gestión de Productos en Confirmit.

«A menudo, las empresas tienen más de 100 terabytes de datos no estructurados -desde las notas de los centros de llamadas y los correos electrónicos de los clientes hasta los comentarios de las encuestas”, afirma. «Cualquier empresa que tenga como objetivo mejorar la experiencia de sus clientes u ofrecer una visión más detallada sobre su marca puede utilizar el PNL para filtrar grandes cantidades de datos y encontrar los datos útiles que se esconden dentro”.

No solo las industrias minoristas y otras orientadas al cliente pueden beneficiarse del PNL, afirma Dakshi Agrawal, miembro de IBM y arquitecto jefe de Inteligencia Artificial. Cualquier empresa que trate con clientes puede aprovechar el PNL para obtener información de sus interacciones, afirma Agrawal, y agrega que «muchas compañías están utilizando las tecnologías para los empleados internos y las relaciones con recursos humanos, de la misma forma en que lo hacen con los clientes externos y los socios”.

Por ejemplo, la agrupación de temas -que utiliza técnicas de PNL, como la sentence embedding, además de la extracción de palabras clave- es más precisa al agrupar los problemas que los clientes pueden informar, utilizando diferentes términos. Destacar esos grupos en un tablero, puede ayudar a revelar problemas de tendencias o problemas repetidos.

Signoi tiene como objetivo abordar los comentarios abiertos en las encuestas mediante la presentación de palabras de uso frecuente, destacando los términos positivos y negativos, y agregándolos por grupo demográfico. El supervisor independiente del transporte británico, Transport Focus, usó Signoi para ver las mayores preocupaciones de los viajeros y pasajeros de ocio en varios servicios de trenes. Los viajeros de negocios estaban enojados por el hacinamiento en una de las líneas; aquellos que tomaron el tren por placer querían un mejor estacionamiento y más espacio para equipaje y bicicletas.

El PNL se puede utilizar para generar léxico con el fin de explicar los resultados. El servicio de analítica de negocios Power BI de Microsoft y Tableau de Salesforce.com ofrecen características que permiten a los usuarios escribir preguntas sobre sus datos y obtener como respuesta gráficos o análisis automatizados.

Saber lo que sabe el negocio
El PNL tiene mucho potencial para ayudar a extraer lo que una organización no sabe que ya sabe.

Las herramientas especializadas basadas en inteligencia artificial, como ABBY Text Analytics for Contracts, Exigent Contract Management Solution o Seal Contract Discovery and Analytics, extraen los términos y plazos de los contratos que pueden ayudar a las organizaciones a comprender a qué se han comprometido. Docugami, la nueva startup del coinventor de XML, Jean Paoli, apunta a hacer eso para documentos menos estructurados.

«Solo el 15% de los datos en una empresa se almacenan en bases de datos. Todos nos comunicamos mediante mensajes de texto, correos electrónicos y documentos. La verdad no está en esas encantadoras bases de datos estructuradas. La verdad está en los documentos”, indica Paoli.

«Veamos, por ejemplo, un negocio que requiere muchos documentos, como los bienes raíces comerciales. Un usuario de negocio de primera línea pasa su tiempo creando 15 contratos de arrendamiento por semana y todos los lunes su gerente pregunta: ‘¿Qué hizo? ¿Cuáles son las fechas de cierre efectivas? ¿Negoció estacionamiento? ¿Quieren que mantengamos la propiedad o no?’ Una vez que firma un documento, esos son los términos que la empresa debe cumplir, pero esa información está oculta en los documentos”, afirma Paoli.

Revelar estos «datos oscuros” podría reemplazar la reunión del lunes por la mañana y mejorar la agilidad empresarial; algo que Paoli señala es más importante que nunca ahora, ya sea que los propietarios le hayan pedido a Starbucks renegociar su contrato de arrendamiento, o que los restaurantes necesiten entender lo que afirma su póliza de seguro.

«En este punto, es aún más importante utilizar el PNL para analizar sus documentos comerciales porque las empresas están repensando su modelo comercial. Es posible que tengan que renegociar todo, y deben comprender cuáles son sus obligaciones y sus riesgos”, afirma Paoli. La empresa de servicios profesionales, Accenture, está haciendo exactamente eso, aplicando su propio PNL para analizar más de un millón de contratos con el fin de comprender sus compromisos y responsabilidades.

Para las organizaciones sin experiencia propia en PNL, el producto SaaS de Docugami funciona con 30 documentos de ejemplo -que puede seleccionar de una carpeta de documentos comerciales- y 30 minutos de comentarios de los usuarios de negocio que crearon los documentos, para capacitar un modelo, según Paoli.

Docugami luego coloca la información en una base de datos para ayudar a crear un panel de control que puede ver en un navegador o integrarse con Excel o Tableau. «Podemos decir ‘mira, eso está por expirar o cuáles documentos tienen una cláusula en particular, excepto esa”, afirma Paoli.

El poder oculto de las reuniones
Extraer información útil de reuniones y conversaciones es un proceso manual laborioso. Algunas llamadas de la empresa ya están transcritas por regulación, pero rara vez se analizan. ¿Cuánto podrían aprender las empresas sobre el progreso de los proyectos o los plazos a partir de lo que se afirma en las reuniones?

Como los empleados de la empresa generalmente pasan el 30% o más de su tiempo en reuniones, gran parte de la información de esas reuniones no se captura de manera significativa, como en el caso de otros datos del negocio, señala el CEO de Otter, Sam Liang.

«¿Cómo se mantiene la comunicación con el equipo, especialmente ahora que uno tiene reuniones de videoconferencia de forma consecutiva?”, afirma Liang.

Las herramientas de transcripción como Otter podrían ayudar con eso. Los subtítulos en vivo, en presentaciones de PowerPoint y reuniones de equipos, o la transcripción de la reunión en vivo que se puede buscar en la plataforma de transmisión Azure Streams, también pueden ser productivos, al proporcionar una transcripción para continuar las conversaciones más tarde, sin depender de alguien que tome notas manualmente.

En el futuro, sugiere Cheng de Microsoft, las plataformas utilizarán la transcripción y el análisis de documentos junto con el reconocimiento de imágenes con el propósito de extraer la «inteligencia colectiva de una reunión” para que sea fácil acceder mientras el grupo continúa trabajando después de la reunión. «Existe la oportunidad de documentar más de lo que está sucediendo y luego hacer que sea más fácil compartirlo con su equipo”, afirma ella.

Bridgewater Associates, por ejemplo, ha grabado todas las reuniones internas durante los últimos 15 años y cualquier empleado puede ver las grabaciones. Debido a que eran difíciles de buscar, rara vez las veían y la compañía ahora está usando Otter para extraer el contenido de las reuniones anteriores.

Del mismo modo, la API de voz a texto, de Azure Cognitive Services -que permite la transcripción de la reunión en vivo de Azure Media Services-, pronto transcribirá los archivos de audio cargados en OneDrive. Los desarrolladores ya pueden crear aplicaciones de transcripción usando esas API, pero tener la funcionalidad integrada directamente en las plataformas hace que esto sea mucho más accesible.

Analítica y precisión
Las transcripciones no siempre son el producto más útil de la aplicación del PNL, aunque pueden proporcionar una línea de tiempo para poner lo que Cheng llama las «pepitas interesantes” que encuentra al buscar en el contexto.

Otter extrae etiquetas como resumen automático para indicar lo que está cubierto en el texto. Los resúmenes automáticos de los documentos escritos están llegando a herramientas como IBM Watson Natural Language Understanding, y Otter está trabajando en algo similar; pero aún es conveniente consultar la transcripción. En el 2018, Microsoft mostró un sistema prototipo para los equipos que crearon y asignaron elementos de acción a partir de las transcripciones de las reuniones y distribuyeron notas de la reunión a los participantes.

A largo plazo, el PNL podría proporcionar analítica de las reuniones: si los mismos temas siguen apareciendo, si el mismo plazo se retrasa, si algunos empleados hablan más que otros -o si hablan de otras personas.

El valor de todo esto depende de la precisión de la transcripción, y la precisión es algo complejo de medir para el PNL en general. Existen puntos de referencia formales en los que muchos sistemas de PNL logran la paridad humana, pero se basan principalmente en el diálogo, y es posible que no le brinden una comparación precisa con lo que desea hacer. No existe una medida útil única, señala Cheng.

«Estamos viendo que las personas combinan capacidades en sistemas multimodales. Es posible que descubra que su sistema de diálogo es realmente excelente, pero en realidad no hace un buen trabajo con los sistemas combinados o de búsqueda en los que tiene el habla, el lenguaje, la visión y los documentos que desea reunir”, afirma.

La precisión de la transcripción varía con la calidad de la grabación, la cantidad de ruido de fondo, los acentos de los altavoces y de qué habla la gente. Para alguien que habla inglés como lengua materna, en un ambiente tranquilo, Liang de Otter afirma que tiene una precisión de más del 95%. En la práctica, las transcripciones son útiles, pero no perfectas.

Independientemente de las herramientas de PNL que utilice, debe estar preparado para invertir tiempo en personalizar el vocabulario de los conceptos y conexiones que son importantes para su negocio, como los términos técnicos de su industria o los nombres de sus propios productos, así como los nombres de los empleados para que sean reconocidos correctamente.

Las organizaciones deben ser conscientes de cuál es el nivel de error aceptable para ellas antes de usar el PNL para algo más que atajos o descubrimientos, pero Cheng sugiere centrarse en la experiencia de extremo a extremo.

«¿Cómo la combino para hacer algo que la gente realmente use, que ayude a su empresa o ayude a sus clientes a hacer algo de forma más eficaz?”, pregunta ella.

«No se tiene que prometer demasiado; la inteligencia artificial no es mágica, pero existen muchas cosas que las herramientas del lenguaje natural pueden mejorar. Los mayores problemas que tiene su empresa hoy en día son probablemente organizar su información, sacar más provecho de los documentos que tiene, y dejar que las personas que tienen la experiencia lo guíen”, afirma Cheng. «Con la inteligencia artificial podemos mejorar la experiencia en la que estamos ahora, donde mucha gente está trabajando de forma remota”.

Mary Branscombe, CIO.com