Reconocimiento facial: qué es y cómo funciona, entre límites y prejuicios

Las herramientas de reconocimiento facial se están volviendo más precisas, pero algunos sistemas muestran prejuicios raciales y los usos de la tecnología son controvertidos.

0
12

¿Pueden los sistemas de reconocimiento identificar su cara a través de las cámaras de vigilancia de CCTV a en la calle? ¿Puede esta identificación llevar a su arresto por una orden de detención pendiente? ¿Qué posibilidades hay de que la identificación sea incorrecta y te conecte con otra persona? ¿Se puede eludir completamente la vigilancia usando algún truco?

Por otra parte, ¿es posible entrar en una bóveda protegida por una cámara y un software de identificación facial mostrando una impresión de la cara de la persona autorizada? ¿Y si se lleva una máscara 3D de la cara de una persona autorizada?

Bienvenido al mundo del reconocimiento facial y las técnicas de evasión.

¿Qué es el reconocimiento facial?
El reconocimiento facial es un método para identificar a una persona desconocida o autentificar la identidad de una persona específica a partir de su rostro. Se trata de un área de la visión artificial, altamente especializada y acompañada de un trasfondo social para algunas aplicaciones, así como de algunas vulnerabilidades a la suplantación de identidad.

¿Cómo funciona el reconocimiento facial?
Los primeros algoritmos de reconocimiento facial, que se siguen utilizando hoy en día de forma mejorada y más automatizada, se basan en la biometría para transformar los rasgos faciales (por ejemplo, la distancia entre los ojos) medidos a partir de una imagen bidimensional en un conjunto de números que describen el rostro, definido como un rasgo vectorial o patrón. El proceso de reconocimiento compara entonces estos vectores con una base de datos de caras conocidas que han sido mapeadas de la misma manera en base a las mismas características. Una complicación en este proceso basado en la geometría de la cara es la normalización de los parámetros para tener en cuenta la rotación e inclinación de la cabeza antes de extraer la métrica.

Otro enfoque fotométrico consiste en normalizar y comprimir imágenes faciales en 2D y compararlas con una base de datos de imágenes igualmente normalizadas y comprimidas.

El reconocimiento facial tridimensional utiliza sensores 3D para capturar la imagen de la cara, o reconstruye la imagen 3D desde tres cámaras de seguimiento 2D que apuntan a diferentes ángulos. El reconocimiento facial en 3D puede ser significativamente más preciso que el reconocimiento en 2D.

El análisis de la estructura de la piel mapea las líneas y manchas en el rostro de una persona a otro vector de características. Añadir el análisis de la textura de la piel al reconocimiento facial en 2D o 3D puede mejorar la precisión del reconocimiento entre un 20 y un 25 por ciento, especialmente en los casos de dobles y gemelos. Es posible combinar todos los métodos y añadir imágenes multiespectrales (luz visible e infrarroja) para una mayor precisión.

Las primeras herramientas de reconocimiento facial se desarrollaron en 1964. Desde entonces han mejorado año tras año y, en promedio, la tasa de error se ha reducido a la mitad cada dos años.

Probando las herramientas de reconocimiento facial
El Instituto Nacional de Estándares y Tecnología (NIST) ha estado probando algoritmos de reconocimiento facial desde el año 2000, el Face Recognition Vendor Test (FRVT). Los conjuntos de datos utilizados son en su mayoría fotos de la policía, pero también incluyen fotos de Wikimedia e imágenes de webcam de baja resolución.

Los algoritmos de FRVT son enviados en su mayoría por los proveedores para la evaluación de sus instrumentos. Las comparaciones interanuales muestran importantes mejoras en el rendimiento y la precisión, debido principalmente al uso de redes neuronales convolutivas en el desarrollo de los algoritmos.

Los programas de prueba de reconocimiento facial del NIST han estudiado los efectos demográficos, la detección del morphing facial, la identificación facial publicada en los medios sociales y la identificación facial en vídeos. Una serie de pruebas anteriores, que se denominaron Tecnología de Reconocimiento de Rostros (FERET), se llevó a cabo en la década de 1990.

Aplicaciones de reconocimiento facial
Las solicitudes de reconocimiento facial se dividen principalmente en tres categorías: seguridad, salud y comercialización/venta al detal. La seguridad incluye las actividades de aplicación de la ley e incluye operaciones como la comparación de las personas con las fotos de los pasaportes, que pueden realizarse más rápidamente y con mayor precisión de con los humanos. Otras aplicaciones de seguridad, no relacionadas con la aplicación de la ley, son el desbloqueo facial de teléfonos móviles y el control de acceso a laboratorios y bóvedas.

Las aplicaciones del reconocimiento facial en el ámbito de la salud incluyen el registro de pacientes, la detección de emociones en tiempo real, la supervisión de pacientes dentro de un centro, la evaluación de los niveles de dolor, la detección de ciertas enfermedades y condiciones, la identificación del personal y la seguridad de las instalaciones.

Las aplicaciones de comercialización y venta al por menor del reconocimiento facial incluyen la identificación de los miembros de un programa de lealtad, la identificación y el seguimiento de los ladrones conocidos y el reconocimiento de las personas y sus emociones para la sugerencia de productos específicos.

Controversias, prejuicios y prohibiciones sobre el reconocimiento facial
Decir que algunas de estas aplicaciones son «controvertidas» es una subestimación. Como señala un artículo del New York Times de 2019, el reconocimiento facial planteó cuestiones de prejuicios y racismo.

Por ejemplo, se utilizó el reconocimiento facial en el Super Bowl de 2001: el programa identificó a 19 personas que se consideraban con órdenes de arresto pendientes, aunque ninguna fue arrestada.

Posteriormente, surgieron problemas de racismo, comenzando con el software de reconocimiento facial de 2009 que podía rastrear a los blancos pero no a los negros, y continuando con un estudio del MIT de 2015 que demostró que el software de reconocimiento facial en ese momento funcionaba mucho mejor en los rostros masculinos blancos que en los rostros femeninos de piel más oscura.

Este tipo de problema llevó a prohibiciones definitivas del software de reconocimiento facial en lugares específicos o para usos concretos. En 2019, San Francisco se convirtió en la primera gran ciudad americana en evitar que la policía y otros organismos de aplicación de la ley utilizaran programas de reconocimiento facial. Microsoft exigió una reglamentación nacional sobre el reconocimiento facial. El MIT mostró que el Reconocimiento del Amazonas tenía más problemas para determinar el sexo femenino que el masculino a partir de las imágenes faciales.

En junio de 2020, Microsoft anunció que no vendió ni venderá su software de reconocimiento facial a la policía. Amazon prohibió a la policía el uso del Rekognition durante un año e IBM abandonó su tecnología de reconocimiento facial. Sin embargo, prohibir por completo el reconocimiento facial no será fácil, dada su amplia adopción en el iPhone (Face ID) y otros dispositivos, software y tecnologías.

No todos los programas de reconocimiento facial sufren los mismos prejuicios. El estudio sobre los efectos demográficos del NIST en 2019 dio seguimiento a la labor del MIT y demostró que el sesgo demográfico algorítmico varía ampliamente entre los desarrolladores de programas informáticos de reconocimiento facial. Sí, hay efectos demográficos en la tasa de desajuste de los algoritmos de identificación facial, pero varían en varios órdenes de magnitud de un fabricante a otro y han disminuido con el tiempo.

Técnicas de «spoofing» para evitar el reconocimiento facial
Dada la posible amenaza a la privacidad del reconocimiento facial y el atractivo de acceder a recursos de alto valor protegidos por la autenticación facial, se han hecho muchos esfuerzos para piratear o falsificar la tecnología. Para superar la autenticación, es posible utilizar una imagen impresa de un rostro en lugar de un rostro vivo, o una imagen en una pantalla, o una máscara impresa en 3D. Para la vigilancia por CCTV, se puede reproducir un video grabado. Para evitar la vigilancia, se pueden utilizar técnicas como el «Computer Vision Dazzle» (CV Dazzle), que consiste en pasar por alto un sistema a través de camuflaje con ropa y maquillaje, y/o emisores de luz infrarroja, para engañar al software de manera que no detecte la cara.

Por supuesto, se han desarrollado técnicas anti-spoofing para contrarrestar todos estos ataques. Para detectar imágenes impresas, los proveedores utilizan pruebas de «vitalidad», que incluyen esperar a que el sujeto parpadee, realizar un análisis de movimiento o utilizar el infrarrojo para distinguir un rostro vivo de una imagen impresa. Otro enfoque consiste en realizar un análisis de microtexturas, ya que la piel humana es ópticamente diferente de las huellas y los materiales de las máscaras. Las últimas técnicas anti-spoofing se basan principalmente en redes neuronales convolucionales profundas.

Este es un campo en evolución. Hay una guerra continua de armas entre los atacantes y el software anti-spoofing, así como investigaciones académicas sobre la efectividad de las diferentes técnicas de ataque y defensa.

Los fabricantes de herramientas de reconocimiento facial
Según la Electronic Frontier Foundation (EFF), el principal proveedor de instrumentos de reconocimiento facial y otras tecnologías de identificación biométrica en los Estados Unidos es MorphoTrust, una filial de Idemia (antes conocida como OT-Morpho o Safran). La empresa ha diseñado sistemas para la aplicación de la ley y el control de fronteras y aeropuertos (incluido el PreCheck de la TSA). Otros proveedores incluyen 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst y NEC Global.

La prueba de reconocimiento facial del NIST lista algoritmos de muchos otros proveedores alrededor del mundo. También hay varios algoritmos de reconocimiento facial de código abierto de diferente calidad, y algunos de los principales proveedores de nubes ofrecen reconocimiento facial.

Amazon Rekognition es un servicio de análisis de imagen y vídeo que puede identificar objetos, personas, texto, escenarios y actividades, incluyendo análisis facial y etiquetas personalizadas. El API de Google Cloud Vision es un servicio de análisis de imágenes pre-entrenado que puede detectar objetos y rostros, leer texto impreso y escrito a mano y crear metadatos en el catálogo de imágenes del usuario. Google AutoML Vision te permite entrenar plantillas de imágenes personalizadas.

El API de Azure Face realiza la detección de rostros y atributos en una imagen, realiza la identificación de personas que coinciden con un individuo en un depósito privado de hasta 1 millón de personas, y realiza el reconocimiento de las emociones percibidas. El Face API puede ejecutarse en la nube o localmente.

En resumen, el reconocimiento facial está mejorando y los vendedores están aprendiendo a detectar la mayoría de las falsificaciones. La tasa de error para el reconocimiento facial se reduce a la mitad cada dos años, según el NIST. Los fabricantes han mejorado sus técnicas anti-spoofing, pero algunas aplicaciones de la tecnología siguen siendo controvertidas.

CWV.it – Redacción Cambio DIgital On Line