Meta afirma que los libros con derechos de autor carecen de "valor económico" en el entrenamiento de su IA

Droids

Updated on:

Meta afirma que los libros con derechos de autor carecen de "valor económico" en el entrenamiento de su IA

La gigante tecnológica Meta se encuentra en el centro de una controversia tras argumentar que los libros protegidos por derechos de autor utilizados para entrenar sus modelos de inteligencia artificial carecen de «valor económico», justificando así su uso sin compensación a los autores.

La polémica defensa de Meta frente a los autores

En una demanda en curso conocida como Richard Kadrey et al v. Meta Platforms, la empresa dirigida por Mark Zuckerberg está siendo acusada de utilizar ilegalmente material protegido por derechos de autor para entrenar sus modelos de IA. Entre los demandantes se encuentran figuras literarias de renombre como Andrew Sean Greer, ganador del Premio Pulitzer, y Ta-Nehisi Coates, ganador del National Book Award.

La acusación principal, según reporta Futurism, es que Meta habría extraído más de siete millones de libros de LibGen, una biblioteca digital conocida por compartir contenido pirata. Frente a estas alegaciones, la defensa de Meta ha provocado indignación en la comunidad literaria.

El controvertido argumento del «valor económico inexistente»

En lugar de negar las acusaciones, Meta ha optado por una estrategia defensiva basada en dos argumentos principales. Primero, sostiene que su supuesta extracción de millones de obras literarias constituye un «uso justo» del material, lo que legalmente no supondría una infracción.

Sin embargo, lo que ha generado mayor controversia es su segundo argumento. Según destaca Vanity Fair en un reciente análisis, Meta afirma que los innumerables libros utilizados para entrenar sus modelos de lenguaje multimillonarios carecen de valor por sí mismos.

La empresa ha citado a un testigo experto que minimizó la importancia individual de los libros, asegurando que un solo libro ajustó el rendimiento de su modelo de lenguaje «menos del 0,06 por ciento en los puntos de referencia estándar de la industria, un cambio insignificante no diferente del ruido».

Meta concluye que no existe un mercado para pagar a los autores por utilizar sus obras protegidas porque, citando textualmente: «para que exista un mercado, debe haber algo de valor para intercambiar, pero ninguna de las obras [de los autores] tiene valor económico, individualmente, como datos de entrenamiento».

Prácticas internas reveladas

Las revelaciones no terminan ahí. Durante el proceso judicial han salido a la luz comunicaciones que muestran que empleados de Meta deliberadamente eliminaron las páginas de copyright de los libros descargados, lo que sugiere conciencia sobre la naturaleza problemática de estas prácticas.

Además, documentos internos citados en la demanda revelan conversaciones entre investigadores de la compañía. Cuando uno de ellos preguntó si el equipo legal había aprobado el uso de LibGen, otro respondió: «No hice preguntas, pero esto es lo que hace OpenAI con GPT3, lo que hace Google con PALM y lo que hace Deepmind con Chinchilla, así que nosotros también lo haremos», según recoge Vanity Fair.

La política de ocultamiento

Quizás más revelador aún es un documento interno que expone la política no oficial de Meta respecto a estas prácticas. Una presentación interna citada en la demanda afirmaba explícitamente: «En ningún caso revelaríamos públicamente que hemos entrenado con LibGen; sin embargo, existe un riesgo práctico de que terceros puedan deducir nuestro uso de este conjunto de datos».

El mismo documento señalaba que «si hay cobertura mediática que sugiera que hemos utilizado un conjunto de datos que sabemos que es pirata, como LibGen, esto podría socavar nuestra posición negociadora con los reguladores sobre estos temas».

La contradicción en el corazón de la industria de IA

Esta defensa de Meta revela una contradicción fundamental en los argumentos que la industria de la inteligencia artificial utiliza cuando se enfrenta a cuestiones de derechos de autor. Por un lado, afirman que el contenido creado por humanos no tiene un valor significativo individualmente. Por otro lado, este mismo contenido resulta absolutamente esencial para construir sus modelos.

Un ejemplo similar ocurrió cuando OpenAI argumentó ante el Parlamento británico el año pasado que no hay suficiente material en el dominio público para fortalecer sus modelos de IA, por lo que debe permitírsele utilizar obras contemporáneas protegidas por derechos de autor sin pagar por ello.

En otro caso relacionado, OpenAI llegó a afirmar que su existencia misma estaría en juego si no pudiera utilizar contenido protegido, como señala Futurism en su artículo OpenAI Says It’s «Over» If It Can’t Steal All Your Copyrighted Work.

Implicaciones para el futuro de los derechos de autor

Este caso representa un momento crucial en el debate sobre cómo equilibrar la innovación tecnológica con la protección de la propiedad intelectual. Las grandes empresas tecnológicas defienden que los datos masivos son necesarios para el avance de la IA, mientras que los creadores argumentan que su trabajo está siendo explotado sin compensación.

La resolución de este litigio podría sentar un precedente importante sobre cómo se interpretarán las leyes de derechos de autor en la era de la inteligencia artificial, especialmente en lo que respecta al concepto de «uso justo» cuando se aplica al entrenamiento de modelos de aprendizaje automático.

Mientras tanto, la revelación de estas prácticas y argumentos defensivos plantea serias preguntas sobre la ética en el desarrollo de tecnologías de IA y sobre la sostenibilidad de un ecosistema creativo donde los creadores de contenido puedan ser justamente compensados por su trabajo.

Deja un comentario