Reddit, la popular plataforma de discusión en línea, ha cerrado acuerdos con Google y OpenAI para el uso de sus datos. Ahora, su CEO, Steve Huffman, exige que Microsoft y otras compañías paguen por extraer información de Reddit. En una reciente entrevista, Huffman denunció a Microsoft Bing, Anthropic y Perplexity por usar datos sin autorización, calificando la situación como “un verdadero dolor de cabeza”.
En un esfuerzo por controlar el uso de su información, Reddit ha actualizado su archivo robots.txt para bloquear rastreadores web no autorizados. Esto ha resultado en que los resultados de Reddit sean visibles solo en Google, con quien tienen un acuerdo, y no en otros motores de búsqueda como Bing.
Huffman explicó que Microsoft ha estado utilizando los datos de Reddit para entrenar su inteligencia artificial y resumir contenido en los resultados de Bing sin informar a Reddit. Además, los datos de Reddit han sido vendidos a través de la API de Bing a otros motores de búsqueda. Huffman también mencionó un comentario reciente del CEO de IA de Microsoft, Mustafa Suleyman, quien afirmó que los datos públicos en internet son “software libre”.
En respuesta, el jefe de búsqueda de Microsoft, Jordi Ribas, comentó en X que Reddit ha bloqueado a Bing de rastrear su sitio, favoreciendo a otro motor de búsqueda y afectando la competencia de Bing. Caitlin Roulston, portavoz de Microsoft, declaró que respetan las indicaciones de los sitios web que no desean que su contenido sea utilizado con sus modelos de IA generativa.
Huffman señaló el reciente anuncio de OpenAI sobre SearchGPT, que mostrará resultados de Reddit gracias a un acuerdo alcanzado a principios de este año, como el modelo que desean replicar. Ninguno de los acuerdos de licencia de contenido que Reddit ha hecho hasta la fecha incluye usos exclusivos para sus datos.
Al exigir acuerdos de licencia, Reddit se une a otros editores de medios tradicionales en buscar pagos por permitir que su contenido alimente la IA generativa. Huffman concluyó que “la búsqueda, la resumida y el entrenamiento se están fusionando, y el intercambio de valor de rastrear a cambio de tráfico de vuelta se está volviendo confuso”.
La postura de Reddit podría establecer un precedente para cómo se negocian los datos en la era de la IA, marcando un cambio significativo en la relación entre las plataformas de contenido y los motores de búsqueda.