Un reciente informe del New York Times ha revelado las estrategias empleadas por los principales actores en el campo de la inteligencia artificial para ampliar su acceso a datos de entrenamiento.

Esta semana, el Wall Street Journal alertó sobre los desafíos que enfrentan las empresas de inteligencia artificial al recopilar datos de entrenamiento de alta calidad. En línea con esta preocupación, The New York Times ha detallado algunas de las tácticas utilizadas por estas empresas. Como era de esperar, estas estrategias a menudo entran en un área gris de la ley de derechos de autor en el ámbito de la inteligencia artificial.

El reporte se centra en OpenAI, que, ante la urgente necesidad de datos de entrenamiento, desarrolló su modelo de transcripción de audio llamado Whisper, transcribiendo más de un millón de horas de videos de YouTube para mejorar su avanzado modelo de lenguaje, GPT-4. Aunque este enfoque plantea cuestiones legales, OpenAI, según The New York Times, consideró que se trataba de un uso justo. El presidente de OpenAI, Greg Brockman, incluso estuvo personalmente involucrado en la recolección de los videos utilizados para este propósito.

Lindsay Held, portavoz de OpenAI, señaló que la empresa crea conjuntos de datos únicos para cada uno de sus modelos con el fin de enriquecer su comprensión del mundo y mantener su competitividad en la investigación global. Held también mencionó que OpenAI utiliza diversas fuentes, incluyendo datos públicos y asociaciones para datos privados, e incluso está explorando la generación de sus propios datos sintéticos.

Según el artículo del Times, la empresa agotó sus fuentes de datos útiles en 2021 y consideró transcribir videos de YouTube, podcasts y audiolibros como una solución alternativa. Además de YouTube, Google también ha recopilado transcripciones de videos, aunque ambas empresas podrían enfrentar desafíos legales por estas prácticas.

Este informe destaca los dilemas éticos y legales que enfrentan las empresas de tecnología en su búsqueda de datos de entrenamiento para mejorar sus modelos de inteligencia artificial. Mientras tanto, el mundo de la inteligencia artificial enfrenta la creciente escasez de datos de entrenamiento, lo que podría obstaculizar el desarrollo futuro de esta tecnología. Las soluciones propuestas, como el entrenamiento con datos sintéticos o el aprendizaje curricular, todavía no han sido plenamente validadas y podrían no ser suficientes para abordar este desafío en constante evolución.

Leave a Reply

Your email address will not be published. Required fields are marked *

You May Also Like

Apple anuncia evento para el 7 de mayo: ¡Descubre los nuevos iPads!

Apple está a punto de desvelar lo que los rumores han estado…

ExxonMobil Engañó al Público sobre el Reciclaje de Plásticos

ExxonMobil ha engañado a los consumidores durante años, perpetuando un “mito” sobre…

El Futuro del Hardware Xbox Bajo Sospecha: Una Reflexión desde Dentro de Microsoft

Una advertencia desde dentro: ¿Está muriendo el hardware de Xbox? Un debate…

Apple renueva Image Playground con la integración de ChatGPT para generar imágenes más realistas y variadas

Cupertino da un giro estratégico para rescatar Image Playground al incorporar la…

Call of Duty: Warzone Regresa a Verdansk con Evento Especial, Recompensas Exclusivas y Prueba Gratuita de Black Ops 6

Activision Celebra el Regreso de Verdansk con un Evento Limitado y Grandes…

Las mejores ofertas en iPads en 2025: guía completa para aprovechar descuentos fuera de eventos masivos

Aunque las ofertas más atractivas en iPads suelen aparecer durante eventos de…

1Password Impacta la Gestión de Contraseñas con su Nueva Función de Geolocalización

La innovadora función “Nearby” mejora la accesibilidad a aplicaciones con cierre de…

Revisión de los Google Pixel Buds Pro 2: gran actualización, auriculares mucho más pequeños

Con una serie de mejoras lideradas por un diseño mucho más cómodo,…

La Quest 3S más barata de Meta podría ser una actualización

Meta está llevando mucho de lo que puedes obtener en la Quest…

Apple Anuncia la Producción Masiva de su Dispositivo Plegable de 18.8 Pulgadas para Finales de 2026: Un Nuevo Hito en la Innovación Tecnológica

Apple, la gigante tecnológica que ha revolucionado el mundo de los dispositivos…