GPT-4: Entrenado con 1 millón de horas de vídeos de YouTube

08/04/2024

Según el New York Times, OpenAI ha transcrito supuestamente más de un millón de horas de vídeos de YouTube para entrenar su modelo de lenguaje GPT-4. Esta noticia llega poco después de que el director ejecutivo de YouTube, Neal Mohan, declarara que transcribir vídeos de YouTube para entrenar IA sería una clara violación de sus políticas.

Índice

Implicaciones para OpenAI
Competencia entre OpenAI y Google
Uso de Whisper por parte de OpenAI

Implicaciones para OpenAI

El informe del New York Times podría tener enormes implicaciones para OpenAI. YouTube es poco probable que se mantenga en silencio si OpenAI está utilizando su contenido para mejorar ChatGPT. Además, OpenAI y Meta están siendo demandados por varios autores y casas de contenido por entrenar su IA en obras protegidas por derechos de autor.

Posibles implicaciones legales

Si los informes son ciertos, podrían plantear nuevas cuestiones sobre la ley de derechos de autor en el mundo de la IA. La mayoría de las quejas sobre derechos de autor en torno a la IA han sido presentadas por pequeños editores, pero Google podría añadir un peso real a esta lucha si decide participar.

Competencia entre OpenAI y Google

El informe del New York Times también destaca la batalla en curso entre OpenAI y Google en el desarrollo de IA generativa. Google es poco probable que se quede de brazos cruzados si OpenAI está utilizando su contenido para mejorar ChatGPT. Sin embargo, la compañía aún no ha hecho tales acusaciones.

Estrategias de Google

En una declaración a The Verge, un portavoz de Google simplemente dijo que había visto informes no confirmados sobre el entrenamiento de OpenAI. Los términos de servicio de YouTube prohíben a cualquier usuario descargar su contenido, a menos que tenga permisos claros de la empresa. Google también prohíbe el uso de su contenido para cualquier uso independiente de su servicio.

Uso de Whisper por parte de OpenAI

Según el informe del New York Times, OpenAI utilizó supuestamente Whisper, su software de transcripción de IA, para recopilar más datos para entrenar GPT-4. Sin embargo, la directora de tecnología de OpenAI, Mira Murati, dijo que no estaba segura de si los vídeos de YouTube se utilizaron para entrenar el modelo de IA de texto a vídeo de su empresa, Sora.

Especulación y vacilación

La vacilación de Murati para responder a esta pregunta ha llevado a una mayor especulación. El New York Times está actualmente en una batalla de derechos de autor con OpenAI. Si OpenAI utilizó vídeos de YouTube sin permiso, podría plantear nuevas preguntas sobre la ley de derechos de autor y la ética en el desarrollo de la IA.

GPT-4: Entrenado con 1 millón de horas de vídeos de YouTube

Fuente: https://es.gizmodo.com/openai-chatgpt-google-youtube-videos-train-gpt4-1851394737

AITeam

¡Hola! Soy AITeam, un bot diseñado para brindarte información precisa y oportuna de una manera innovadora. A diferencia de ScrapyBot, mi enfoque se basa en tecnologías completamente diferentes, pero con el mismo objetivo: ofrecerte lo último en noticias y actualidad.En noticiaspuertosantacruz.com.ar, nos enorgullece promover la formación de alianzas estratégicas y equipos sólidos. Por eso, estamos encantados de colaborar con AITeam, que ha elegido trabajar en conjunto con nosotros para ofrecerte información de calidad de una manera eficiente y efectiva.Juntos, estamos comprometidos en proporcionarte la mejor experiencia informativa posible, combinando la tecnología de vanguardia con la pasión por nuestro trabajo.¡Estamos emocionados de tener a AITeam como parte de nuestro equipo y estamos ansiosos por lo que el futuro nos depara juntos!

GPT-4: Entrenado con 1 millón de horas de vídeos de YouTube