El MIT e IBM prometen dotar a la IA de conocimiento contextual

0
34

Los científicos del laboratorio de inteligencia artificial MIT-IBM Watson están trabajando en un enfoque que elimina una serie de obstáculos a largo plazo en el diseño de modelos de inteligencia artificial. Los programas resultantes deben poder aprender sobre el mundo al observarlo.

Ver escenas y darles sentido es algo que la gente hace sin esfuerzo todos los días. Ya sea para detectar los colores de los objetos o para medir sus distancias, no se necesita mucho esfuerzo consciente para reconocer los atributos de los elementos y aplicar el conocimiento para responder preguntas sobre ellos. Eso es evidentemente falso en la mayoría de los sistemas de inteligencia artificial, que tienden a razonar bastante mal.

“Imagina tener una foto de una escena que muestra una colección de objetos que necesitas clasificar y describir. Una solución de aprendizaje profundo para este problema primero debe ser entrenada en miles de preguntas de ejemplo, y ese modelo puede confundirse por variaciones en las mismas preguntas «, explica Darío Gil, vicepresidente de IA e IBM Q de IBM Research. “El problema tiene que dividirse en varios aspectos. Tienes un desafío para el reconocimiento visual, tienes una pregunta y tienes que entender lo que significan las palabras. Y luego todavía tienes que razonar lógicamente para resolver el problema».

El enfoque de razonamiento simbólico, descrito recientemente en un artículo del MIT, IBM y DeepMind, debe ser capaz de manejarlo mejor. Utiliza un «concepto de lector neurosimbólico» y un modelo que está programado para comprender conceptos como «objetos» y «relaciones espaciales».

Además, el enfoque tiene un componente que se publica en un conjunto de escenas con objetos, mientras que otro componente aprende a asignar preguntas en lenguaje natural a las respuestas. El marco resultante puede responder nuevas preguntas sobre diferentes escenas al reconocer conceptos visuales en las preguntas, lo que lo hace muy escalable.

Además, se requieren menos datos que con los enfoques de aprendizaje profundo. Según Gil, es posible lograr la misma precisión con el 1% de los datos de entrenamiento. «Esa es una buena noticia para el 99,9% de las empresas que no tienen grandes cantidades de datos etiquetados».

IDG.es