Los correos de Meta revelan que descargó 81,7 TB de libros con copyright vía BitTorrent para entrenar sus modelos de IA

Escrito por Eduardo Peralta

La Inteligencia Artificial al Alcance de Todos

Meta en la Mira: La Controversia de la Descarga Masiva de Libros con Copyright

Un Escándalo Legal que Sacude a la Industria

En el marco del proceso legal conocido como Kadrey contra Meta, la empresa de Mark Zuckerberg se enfrenta a serias acusaciones por haber utilizado múltiples obras protegidas por derechos de autor para entrenar sus modelos de inteligencia artificial. Recientemente, se reveló que el propio Zuckerberg autorizó el uso de libros pirateados, poniendo a la compañía en el ojo del huracán por sus prácticas cuestionables.

Correos que Revelan una Práctica Ilegal

El «apéndice A» del caso incluye correos electrónicos internos que muestran la conexión entre empleados de Meta y las descargas masivas de libros. Una de las empleadas, Melanie Kambadur, expresó su descontento con esta recolección de datos en octubre de 2022, lo que pone de manifiesto el conocimiento interno sobre la ilegalidad de estas acciones.

La Bromosa Advertencia sobre Torrent

En abril de 2023, Nikolay Bashlykov, responsable de la recolección de datos, insinuó que descargar libros mediante torrents desde un dispositivo de la empresa no era la mejor estrategia, haciendo hincapié en la preocupación sobre la dirección IP utilizada para las descargas. Este comentario, inicialmente humorístico, aumenta las alarmas sobre la legalidad del proceso.

Conocimiento de Riesgos y Consecuencias

Más tarde, Bashlykov dejó de lado los emojis y comenzó a advertir sobre el uso de torrents. Este tipo de descarga podía hacer que se actuara como «semillas», facilitando la distribución de los archivos y presentando riesgos legales evidentes. Aquí se apunta a que Meta era consciente de que sus acciones podían considerarse ilegales.

Una Estrategia para Ocultar Evidencias

Un mensaje interno de Frank Zhang, investigador de Meta, sugería que evitar el uso de los servidores de la empresa para estas descargas era una táctica diseñada para proteger la identidad de quienes llevaban a cabo la operación, subrayando aún más la intención de ocultar las actividades ilícitas.

¿Cuánto se Descargó Realmente?

Las pruebas indican que Meta descargó más de 81,7 terabytes de libros de diversas bibliotecas electrónicas, con al menos 35,7 TB provenientes de sitios como Z-Library o LibGen, conocidas fuentes de contenido protegido. Este volumen de datos plantea serias preguntas sobre las prácticas de recolección de información en la empresa.

Meta Busca Desestimar los Cargos

A pesar de la evidencia presentada, Meta ha solicitado que se desestimen las acusaciones, argumentando que no existen pruebas de que se hayan descargado libros a través de torrents para ser distribuidos posteriormente. La defensa de la compañía continúa mientras la polémica genera bastante debate.

Impacto en el Entrenamiento de Modelos de IA

Este escándalo pone de relieve un problema más amplio en la industria de la inteligencia artificial, donde las prácticas para entrenar modelos suelen ser discutibles y, a menudo, ilegales. El caso de Meta se suma a otros incidentes similares con empresas como Google y OpenAI, que también han sido acusadas de utilizar contenido con derechos de autor sin permiso.

Normalización de la Violación de Derechos de Autor

A medida que las empresas buscan avanzar en la tecnología de IA, se está normalizando la violación de derechos de autor en la esfera digital. Esta tendencia plantea interrogantes sobre la ética detrás de las prácticas comerciales y el respeto por el trabajo creativo.

¿Es Realmente “Uso Justo”?

El concepto de «uso justo» se utiliza a menudo como uniforme entre las empresas, que justifican la utilización de contenido protegido bajo ciertas circunstancias. Sin embargo, la proliferación de demandas por violaciones de derechos de autor en la IA generativa evidencia una problemática que parece ser constantemente ignorada en aras del progreso tecnológico.

Deja un comentario