Meta ha entrenado Llama con libros protegidos por derechos de autor. Zuckerberg lo sabía y le dio igual

Escrito por Eduardo Peralta

La Inteligencia Artificial al Alcance de Todos

¿Cómo Meta ha entrenado a Llama con libros pirateados?

Un escándalo legal que sacude al gigante tecnológico

Meta, la empresa de Mark Zuckerberg, ha sido objeto de controversia después de que se revelara que su modelo de inteligencia artificial, Llama, fue entrenado usando libros protegidos por derechos de autor. Documentos recientes de un proceso legal han desvelado detalles inquietantes sobre las prácticas de la empresa en este sentido.

Libros pirateados para un modelo que presume ser Open Source

En el caso conocido como Kadrey contra Meta, que involucra a autores reconocidos como Sarah Silverman y Ta-Nehisi Coates, se alegó que la compañía utilizó obras protegidas para entrenar sus modelos de inteligencia artificial. Los documentos filtrados parecen confirmar estas acusaciones, poniendo en entredicho la imagen de transparencia de Meta.

Zuckerberg dio luz verde a la controversia

Testimonios dentro del caso sugieren que Zuckerberg autorizó el uso de un conjunto de datos conocido como LibGen, a pesar de las preocupaciones de su equipo. Algunos empleados advirtieron que esta decisión podría poner en riesgo la posición de la empresa frente a los reguladores. Sin embargo, el CEO de Meta siguió adelante, desestimando las advertencias.

Un vistazo a LibGen

LibGen, o Library Genesis, se describe a sí mismo como un «agregador de enlaces», pero operaba como una vasta biblioteca pirata, ofreciendo acceso a textos con derechos de autor de editoriales como McGraw Hill y Pearson Education. A pesar de haber sido demandada y multada en múltiples ocasiones, su operación sigue siendo un área gris en la legalidad del acceso a materiales académicos y literarios.

La voracidad de datos en la era de la inteligencia artificial

En un contexto donde las empresas tecnológicas luchan por obtener grandes volúmenes de datos, se ha informado que Meta ha llegado a contratar personas para resumir libros prohibidos. A pesar de sus críticas hacia OpenAI por prácticas similares, Meta continúa utilizando métodos cuestionables para adquirir información valiosa.

El intento de ocultar el copyright

De acuerdo con el abogado de los demandantes, un ingeniero de Meta creó software con el objetivo de eliminar las etiquetas de copyright de los libros electrónicos recolectados. Esto no solo refleja la intención de entrenar el modelo Llama, sino que también sugiere un esfuerzo por eludir las normativas de derechos de autor al acceder a estos materiales.

Más que solo entrenamiento: distribución de contenido

Además de solo usar las obras para entrenamiento, Meta aparentemente también ayudó en la distribución de las mismas, convirtiéndose en un nodo dentro de la red torrent que facilitaba este intercambio ilegal. Esta práctica agrava aún más las acusaciones en su contra, resaltando una violación sistemática de los derechos de autor.

Un panorama complicado para Meta

A pesar de las graves acusaciones, el futuro del caso sigue siendo incierto. En 2023, un juzgado desestimó un caso similar contra Meta bajo el argumento de uso justo. Sin embargo, esto podría no ser suficiente en el actual contexto, donde el juez se ha mostrado dispuesto a examinar los detalles de las confesiones presentadas.

¿Un problema que va más allá de Meta?

Aunque Meta es el objetivo principal de esta demanda, es importante señalar que no es la única empresa en la mira. Otras empresas, como OpenAI, también enfrentan acusaciones de prácticas similares en la captación de datos. La carga recae sobre el titán tecnológico, que enfrenta un creciente número de denuncias por su enfoque hacia el contenido protegido.

Conclusión: La lucha por los derechos de autor en la era digital

Lo que está ocurriendo con Meta y su modelo Llama pone de manifiesto un dilema crítico dentro del desarrollo de la inteligencia artificial: la ética versus la necesidad de datos masivos. Este escenario invita a reflexionar sobre las prácticas de las empresas ante la creciente demanda de modelos de IA en una sociedad que cada vez es más consciente de la protección de los derechos de autor.

Deja un comentario