Un juez federal de Estados Unidos ha determinado que la forma en que Meta obtuvo los libros para entrenar a su modelo de inteligencia artificial Llama es un factor relevante en la demanda por derechos de autor presentada por un grupo de autores. Aunque Meta ha salido victoriosa en la mayor parte del litigio, el juez Vince Chhabria ha rechazado el intento de la compañía de descartar la acusación de que infringió la ley al descargar masivamente libros de bibliotecas pirata a través de la red BitTorrent. La decisión mantiene viva una parte clave del caso y sienta las bases para un enfrentamiento centrado en las prácticas de adquisición de datos de la gigante tecnológica.
La demanda de derechos de autor llega a su fase final
El caso, que ha captado la atención del sector tecnológico y editorial, fue iniciado por un grupo de 13 autores, entre los que se encuentran figuras de renombre como la comediante Sarah Silverman y el escritor ganador del Premio Pulitzer, Junot Diaz. Su principal argumento era que Meta había violado sus derechos de autor al utilizar sus obras sin permiso para entrenar a sus modelos de lenguaje grande (LLM) de la familia Llama.
Recientemente, el juez Chhabria desestimó la mayor parte de estas reclamaciones, al considerar que los demandantes no habían presentado argumentos sólidos para demostrar que la IA de Meta competía directamente o diluía el mercado de sus libros. Sin embargo, una acusación secundaria ha sobrevivido: la que se centra en el método de obtención de los datos. Según los autores, Meta descargó mediante torrents más de 81,7 terabytes de libros pirateados, una acción que, según ellos, constituye una distribución ilegal de sus obras.
En una resolución judicial emitida recientemente, el juez Chhabria confirmó que las partes se reunirán el próximo 11 de julio para «discutir cómo proceder en la reclamación separada de los demandantes de que Meta distribuyó ilegalmente sus obras protegidas durante el proceso de torrenting«.
¿Por qué es relevante la descarga de 80 TB de libros?
El equipo legal de Meta había intentado argumentar que la forma en que se obtuvieron los libros era «completamente irrelevante» para el análisis de «uso legítimo» (fair use), un concepto legal estadounidense que permite el uso limitado de material protegido sin permiso bajo ciertas condiciones. Sin embargo, el juez Chhabria desmontó esta defensa, calificando el uso de torrents por parte de la compañía como «al menos potencialmente relevante» de varias maneras.
Primero, el juez señaló que la decisión de Meta de recurrir a bibliotecas pirata como LibGen, de donde supuestamente se obtuvieron más de 80 terabytes de datos, es «relevante para la cuestión de la mala fe». Este es un factor que se considera en el análisis del «uso legítimo». Según expone Chhabria en su auto, los demandantes argumentaron que Meta había iniciado conversaciones con algunas editoriales para licenciar obras, pero «tras no conseguir las licencias», el CEO Mark Zuckerberg «escaló» el asunto, lo que llevó a la decisión de obtener los libros de fuentes ilegales.
Segundo, el magistrado sugirió que el caso contra Meta se fortalecería si los autores pudieran demostrar que su actividad benefició a las propias bibliotecas pirata. «La descarga de material protegido por derechos de autor de bibliotecas en la sombra por parte de Meta» también sería relevante, escribió Chhabria, «si benefició a quienes crearon las bibliotecas y, por lo tanto, apoyó y perpetuó su copia y distribución no autorizadas de obras protegidas».
A pesar de estos puntos, el juez también ofreció un argumento que favorece a Meta. Señaló que no se puede separar la descarga de los libros de su propósito final. Dado que el objetivo de Meta era entrenar a Llama, un uso que el propio juez considera «altamente transformativo», la acción de descargar los libros para ese fin también adquiere ese carácter. «Debido a que el uso final de los libros de los demandantes por parte de Meta fue transformativo, también lo fue la descarga de esos libros por parte de Meta», concluyó el juez.
El desafío probatorio: una batalla cuesta arriba para los autores
Aunque el juez ha dado validez a sus argumentos, también ha advertido que los autores se enfrentan a un serio desafío. En su resolución, Chhabria dejó claro que, hasta la fecha, los demandantes «no han presentado ninguna prueba» que demuestre cómo las descargas de Meta pudieron «sostener» o beneficiar financieramente a las bibliotecas pirata.
Este punto es crucial, ya que el juez mencionó que «la gran mayoría de los casos» relacionados con el intercambio de archivos entre pares (peer-to-peer) como BitTorrent se consideran una infracción de los derechos de autor. No obstante, sin pruebas concretas, la acusación podría desmoronarse. El juez reconoció que el registro sobre esta presunta distribución es «incompleto», en parte porque este asunto se planteó tarde en el proceso judicial.
En una nota a pie de página, Chhabria especuló con la posibilidad de que los autores pudieran demostrar que Meta «contribuyó a la red BitTorrent» al aportar una potencia de cálculo significativa, lo que podría haber ayudado a las bibliotecas pirata. Sin embargo, también criticó a los demandantes por basar parte de su argumentación en un anticuado artículo de Ars Technica de 2010 que sugería que la piratería de libros electrónicos era poco común, una realidad que ha cambiado drásticamente desde entonces.
El futuro del entrenamiento de la IA y el mercado de las licencias
Más allá de quién gane esta batalla legal, el juez Chhabria dedicó una parte de su escrito a reflexionar sobre las implicaciones a largo plazo del caso. Sugirió que uno de los resultados, ganen o pierdan los autores, podría ser la incentivación de un mercado de licencias para el entrenamiento de la IA.
«Puede que las editoriales no posean actualmente los derechos subsidiarios necesarios para hacer posible la concesión de licencias colectivas», escribió el juez. «Pero es difícil creer que no empiecen pronto a negociar esos derechos con sus autores para poder entablar negociaciones y concesiones de licencias a gran escala» con los desarrolladores de LLM.
Chhabria opina que este escenario es especialmente probable si la única alternativa para las empresas de IA es «obtener licencias o renunciar al uso de libros protegidos como datos de entrenamiento». En este contexto, si las empresas tecnológicas optan por usar solo obras de dominio público, «eso indicaría que en realidad no necesitan las obras protegidas tanto como dicen», lo que debilitaría la justificación para recurrir a la piratería.
El caso contra Meta, aunque parcialmente resuelto, sigue siendo un campo de batalla fundamental donde se están definiendo los límites legales de la inteligencia artificial. La vista del 11 de julio será clave para determinar si el uso de torrents por parte de una de las mayores empresas tecnológicas del mundo constituye un acto de infracción de derechos de autor que deba ser penalizado.






