Google introduce Google-Extended para impedir a Bard y Vertex AI a través de robots.txt nutrirse del contenido de su sitio WEB

0
44

Google ha anunciado hoy un nuevo «token de producto independiente», Google-Extended, que le permite controlar si Bard y Vertex AI pueden acceder al contenido de su sitio.

Este parece ser el resultado final de un «debate público» que Google inició en julio, cuando la empresa prometió reunir «voces de todos los editores web, la sociedad civil, el mundo académico y más campos» para hablar sobre la elección y el control del contenido web.

Bard es la herramienta de IA conversacional de Google. Vertex AI es la plataforma de aprendizaje automático de Google para crear y desplegar aplicaciones de búsqueda y chat basadas en IA generativa.

En una entrada de blog, Danielle Romain, V.P. Trust de Google dijo:

«Hoy anunciamos Google-Extended, un nuevo control que los editores web pueden utilizar para gestionar si sus sitios ayudan a mejorar las API generativas de Bard y Vertex AI, incluidas las futuras generaciones de modelos que impulsan esos productos. Al utilizar Google-Extended para controlar el acceso al contenido de un sitio, el administrador de un sitio web puede decidir si ayuda a que estos modelos de IA sean más precisos y capaces con el tiempo».

¿Qué es Google-Extended? Google lo denomina «Un token de producto independiente que los editores web pueden utilizar para gestionar si sus sitios ayudan a mejorar las API generativas de Bard y Vertex AI, incluidas las futuras generaciones de modelos que potencian esos productos».

El nuevo rastreador se ha añadido a la documentación de Google Search Central sobre rastreadores web.

La empresa afirma que Google-Extended ofrece a los editores «opciones y control»:

«Poner a disposición controles sencillos y escalables, como Google-Extended, a través de robots.txt es un paso importante para proporcionar transparencia y control que creemos que todos los proveedores de modelos de IA deberían poner a disposición». Sin embargo, a medida que las aplicaciones de IA se expandan, los editores web se enfrentarán a la creciente complejidad de gestionar diferentes usos a escala.»

Puede utilizar robots.txt para impedir que Google-Extended acceda a su contenido o a partes de él. Para bloquear completamente Google-Extended, añada lo siguiente al archivo robots.txt de su sitio:

User-agent: Google-Extended
Disallow: /

Sabemos que 242 de los 1.000 sitios web más populares ya han decidido bloquear GPTBot, el rastreador web de OpenAI, desde su lanzamiento en agosto. Ahora puede decidir si tu sitio web debe optar por no ayudar a Google a mejorar sus productos de IA.

Fuente WEB | Editado por CambioDigital OnLine

Custom Text
Artículo anteriorNuevos protocolos de red, LG bate un récord en 6G
Artículo siguienteLos altos directivos son más propensos a hacer clic en correos electrónicos de phishing