Reddit impone tarifas a los motores de búsqueda que indexan su contenido

0
16

Reddit está intensificando su ofensiva contra los rastreadores web. En las últimas semanas, Reddit ha empezado a bloquear los motores de búsqueda para que no muestren entradas y comentarios recientes a menos que el motor de búsqueda pague, según un informe de 404 Media.

Ahora mismo, Google es el único motor de búsqueda que muestra resultados recientes cuando se buscan entradas en Reddit utilizando el truco «site:reddit.com», informa 404 Media. Esto deja fuera a Bing, DuckDuckGo y otras alternativas, probablemente porque Google ha llegado a un acuerdo de 60 millones de dólares que permite a la compañía entrenar sus modelos de inteligencia artificial en el contenido de Reddit.

«Esto no tiene nada que ver con nuestra reciente asociación con Google», afirma Tim Rathschmidt, portavoz de Reddit, en un comunicado enviado a The Verge. «Hemos estado en conversaciones con múltiples motores de búsqueda. No hemos podido llegar a acuerdos con todos ellos, ya que algunos no pueden o no quieren hacer promesas ejecutables con respecto a su uso del contenido de Reddit, incluido su uso para la IA.»

El mes pasado, para hacer cumplir su política contra el scraping, Reddit actualizó el archivo robots.txt del sitio, que indica a los rastreadores web si pueden acceder a un sitio. «Es una señal para aquellos que no tienen un acuerdo con nosotros de que no deberían acceder a los datos de Reddit», dijo Ben Lee, director jurídico de Reddit, a mi colega Alex Heath en Command Line.

En una declaración a The Verge, la portavoz de Microsoft Caitlin Roulston dijo: «Microsoft respeta la norma robots.txt y honramos las instrucciones proporcionadas por los sitios web que no quieren que el contenido de sus páginas sea utilizado con nuestros modelos generativos de IA», añadiendo que Bing dejó de rastrear Reddit cuando la plataforma actualizó su archivo robots.txt el 1 de julio.

Es un movimiento audaz para un sitio web masivo como Reddit bloquear algunos de los motores de búsqueda más populares, pero no es tan sorprendente. En el último año, Reddit se ha vuelto más protectora con sus datos, ya que busca abrir otra fuente de ingresos y apaciguar a nuevos inversores. Después de encarecer su API para algunos desarrolladores externos, Reddit amenazó a Google con cortarle el grifo si no dejaba de utilizar los datos de la plataforma para entrenar IA de forma gratuita.

Con los chatbots de inteligencia artificial llenando Internet de contenidos cuestionables, encontrar cosas escritas por un ser humano nunca ha sido tan importante. Muchos han empezado a añadir «Reddit» a las búsquedas solo para obtener respuestas humanas, y podría ser frustrante saber que ahora solo podrán hacerlo en Google (o en los motores de búsqueda que dependen de él).

Fuente WEB | Editado por CambioDigital OnLine

 

Custom Text
Artículo anteriorEl primer reactor nuclear a prueba de fusión supera la prueba de pérdida de refrigeración en China
Artículo siguienteOpenAI desafía a Google y prueba un motor de búsqueda basado en IA