BREIN elimina conjunto de datos de idioma para evitar problemas de derechos de autor en IA
En una medida para proteger los derechos de autor, el grupo holandés de protección de derechos de autor BREIN ha eliminado un extenso conjunto de datos de lenguaje que se ofrecía para uso en el entrenamiento de modelos de Inteligencia Artificial.
Un tesoro de información, pero no sin permiso
El conjunto de datos incluía información recopilada sin autorización de decenas de miles de libros, sitios de noticias y subtítulos en holandés extraídos de "innumerables" películas y series de televisión, indicó BREIN en un comunicado.
Bastiaan van Ramshorst, director de BREIN, declaró a Reuters que no estaba claro si las empresas de Inteligencia Artificial ya habían utilizado el conjunto de datos o en qué medida lo habían hecho.
"Es muy difícil saberlo, pero estamos intentando actuar a tiempo" para evitar futuros litigios, afirmó.
Señaló que la Ley de Inteligencia Artificial de la Unión Europea exigirá a las empresas de Inteligencia Artificial que divulguen qué conjuntos de datos han utilizado para entrenar sus modelos.
Casos similares y la acción de BREIN
En Estados Unidos, OpenAI, respaldada por Microsoft, ha enfrentado varias demandas, incluida una del New York Times, por presuntamente utilizar material con derechos de autor para entrenar sus modelos sin permiso.
En Dinamarca, un grupo de protección de derechos de autor llamado Danish Rights Alliance obligó a eliminar un enorme conjunto de datos conocido como "Books3" el año pasado.
La persona que ofrecía el conjunto de datos holandés aceptó los términos de una orden de cese y desistimiento y lo eliminó de un sitio web donde estaba disponible para su descarga, informó BREIN.
La organización no reveló la identidad de la persona, citando las normas de privacidad holandesas.
Fuente: https://finance.yahoo.com/news/copyright-group-takes-down-dutch-133316129.html
Artículos relacionados