Google Books, una herramienta esencial para académicos al indexar material publicado, ha comenzado a indexar libros de baja calidad, lo que podría impactar negativamente en su herramienta de seguimiento del lenguaje, Ngram.

Según el informe de 404Media, Google Books ha incluido varios libros que podrían haber sido generados por inteligencia artificial (IA). La publicación realizó una búsqueda en Google Books utilizando el término “as of my last knowledge update”, una frase comúnmente empleada por chatbots como ChatGPT. Esta función permite buscar frases o términos específicos, devolviendo generalmente obras que contienen dichas frases.

404Media descubrió que, si bien la mayoría de los libros en las primeras páginas de la búsqueda trataban sobre IA, también había algunos resultados que no abordaban la tecnología y aparentaban ser escritos por un bot.

Se menciona que libros como “Bears, Bulls, and Wolves: Stock Trading for the Twenty-Year-Old” de Tristin McIver, parecían haber obtenido información de Wikipedia sobre eventos financieros y utilizaban la frase “as of my last knowledge update”. Además, otros libros sobre temas como Twitter aún contenían información del año 2021, cuando algunos modelos de IA habrían recibido por última vez datos de entrenamiento.

Google Books constituye la principal fuente de datos para su visor de Ngram, una herramienta de investigación que analiza la evolución del lenguaje a lo largo del tiempo mediante el análisis de obras escritas.

Es relevante señalar que Google Books ha escaneado e indexado obras escritas que datan desde el siglo XVI, mientras que Ngram actualizó por última vez los datos en 2019. A pesar de que Ngram no es perfecto, es ampliamente utilizado por lingüistas y académicos para recopilar información en sus investigaciones.

Google ha comunicado a 404Media que las obras recientes en Google Books no aparecen en los resultados de Ngram en la actualidad, aunque es posible que estas sean incluidas en futuras actualizaciones de datos.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

La plataforma de criptomonedas de Trump ya está abierta al público

Las personas detrás de World Liberty Financial — el expresidente Donald Trump,…

AeroGarden Cierra: Adiós a los Jardines Inteligentes a Partir de Enero 2025

AeroGarden, conocido por sus innovadores kits de jardines inteligentes para interiores, ha…

Familias de víctimas del tiroteo en Uvalde demandan a Activision y Meta

Las familias de las víctimas del trágico tiroteo en la escuela de…

La Propuesta de una Xbox Steam Deck por Microsoft

En un mercado de juegos cada vez más competitivo, la necesidad de…

La Investigación Antimonopolio de Nvidia sobre IA se Intensifica, Informa Bloomberg

La investigación antimonopolio del Departamento de Justicia de los Estados Unidos centrada…

Ford Explorer EV para Europa: Autonomía de 375 Millas y Novedades de Última Generación

El Ford Explorer EV exclusivo para el mercado europeo ha sido revelado…

OpenAI transcribió más de un millón de horas de videos de YouTube para entrenar a GPT-4

Un reciente informe del New York Times ha revelado las estrategias empleadas…

Apple Intelligence: cada nueva característica de IA que llega al iPhone y Mac

Apple anunció “Apple Intelligence” en la WWDC 2024, su nombre para un…

El DOJ demanda a Visa por monopolio y exclusión de competidores en el sector de pagos

El Departamento de Justicia de EE. UU. ha presentado una demanda antimonopolio…

AnandTech Cierra Después de 27 Años

AnandTech, un sitio web influyente en el ámbito del hardware, cierra sus…