GPT-4: Entrenado con 1 millón de horas de vídeos de YouTube
Según el New York Times, OpenAI ha transcrito supuestamente más de un millón de horas de vídeos de YouTube para entrenar su modelo de lenguaje GPT-4. Esta noticia llega poco después de que el director ejecutivo de YouTube, Neal Mohan, declarara que transcribir vídeos de YouTube para entrenar IA sería una clara violación de sus políticas.
Implicaciones para OpenAI
El informe del New York Times podría tener enormes implicaciones para OpenAI. YouTube es poco probable que se mantenga en silencio si OpenAI está utilizando su contenido para mejorar ChatGPT. Además, OpenAI y Meta están siendo demandados por varios autores y casas de contenido por entrenar su IA en obras protegidas por derechos de autor.
Posibles implicaciones legales
Si los informes son ciertos, podrían plantear nuevas cuestiones sobre la ley de derechos de autor en el mundo de la IA. La mayoría de las quejas sobre derechos de autor en torno a la IA han sido presentadas por pequeños editores, pero Google podría añadir un peso real a esta lucha si decide participar.
Competencia entre OpenAI y Google
El informe del New York Times también destaca la batalla en curso entre OpenAI y Google en el desarrollo de IA generativa. Google es poco probable que se quede de brazos cruzados si OpenAI está utilizando su contenido para mejorar ChatGPT. Sin embargo, la compañía aún no ha hecho tales acusaciones.
Estrategias de Google
En una declaración a The Verge, un portavoz de Google simplemente dijo que había visto informes no confirmados sobre el entrenamiento de OpenAI. Los términos de servicio de YouTube prohíben a cualquier usuario descargar su contenido, a menos que tenga permisos claros de la empresa. Google también prohíbe el uso de su contenido para cualquier uso independiente de su servicio.
Uso de Whisper por parte de OpenAI
Según el informe del New York Times, OpenAI utilizó supuestamente Whisper, su software de transcripción de IA, para recopilar más datos para entrenar GPT-4. Sin embargo, la directora de tecnología de OpenAI, Mira Murati, dijo que no estaba segura de si los vídeos de YouTube se utilizaron para entrenar el modelo de IA de texto a vídeo de su empresa, Sora.
Especulación y vacilación
La vacilación de Murati para responder a esta pregunta ha llevado a una mayor especulación. El New York Times está actualmente en una batalla de derechos de autor con OpenAI. Si OpenAI utilizó vídeos de YouTube sin permiso, podría plantear nuevas preguntas sobre la ley de derechos de autor y la ética en el desarrollo de la IA.
Fuente: https://es.gizmodo.com/openai-chatgpt-google-youtube-videos-train-gpt4-1851394737
Artículos relacionados