La batalla legal entre Thomson Reuters y ROSS Intelligence ha causado una gran conmoción en las industrias de la IA y la tecnología legal. El 11 de febrero de 2025, el Tribunal de Distrito de los Estados Unidos para el Distrito de Delaware dictaminó que ROSS Intelligence había infringido los derechos de autor de Thomson Reuters al utilizar el contenido editorial de Westlaw (notas descriptivas) para entrenar su herramienta de investigación legal impulsada por IA. Esta decisión tiene profundas implicaciones para el desarrollo de la IA, en particular en la forma en que las empresas adquieren y utilizan los datos de entrenamiento.
Antecedentes: El caso que sacudió el desarrollo de la IA
Thomson Reuters es propietaria de Westlaw , una plataforma de investigación jurídica de primer nivel que incluye contenido editorial exclusivo, como notas breves de sentencias judiciales. ROSS Intelligence quería desarrollar un asistente legal basado en inteligencia artificial e inicialmente se acercó a Thomson Reuters para obtener un acuerdo de licencia. Cuando Thomson Reuters se negó, ROSS obtuvo miles de Bulk Memos (resúmenes de contenido de Westlaw creados por contratistas externos) para entrenar su modelo de inteligencia artificial.
Thomson Reuters argumentó que, aunque ROSS no copió directamente las notas de Westlaw, la naturaleza derivada de los Bulk Memos constituía una infracción de los derechos de autor. El tribunal estuvo de acuerdo, rechazó la defensa de uso justo de ROSS y reforzó las protecciones de derechos de autor para el contenido legal seleccionado.
Por qué este caso es importante para la IA y la legislación sobre derechos de autor
Esta sentencia sienta un precedente jurídico importante que podría determinar el futuro del desarrollo de la IA. A continuación, se explican los motivos:
1. Aplicación más estricta de los derechos de autor sobre los datos de entrenamiento de la IA
Las empresas de inteligencia artificial han recurrido durante mucho tiempo a la recopilación y el análisis de grandes cantidades de datos de texto, a menudo extraídos de libros, artículos de noticias y bases de datos en línea. Esta sentencia deja claro que:
- Incluso el contenido derivado basado en material protegido por derechos de autor puede considerarse una infracción.
- Las empresas emergentes de inteligencia artificial deben obtener licencias explícitas antes de utilizar datos confidenciales.
- Empresas como Westlaw, Bloomberg y editoriales científicas podrían endurecer las restricciones sobre sus contenidos.
2. Los límites del uso legítimo en la IA
ROSS argumentó que su uso de resúmenes legales se enmarcaba en el uso legítimo , una defensa que permite el uso limitado de material protegido por derechos de autor para fines como la investigación y la educación. Sin embargo, el tribunal dictaminó que:
- El uso de notas de cabecera por parte de la IA era comercial y competitivo .
- Los datos fueron transformados, pero no lo suficiente como para calificar como uso justo.
- El simple hecho de resumir o reformular un contenido protegido por derechos de autor no implica automáticamente que su uso sea gratuito .
Esto genera preocupación para los desarrolladores de IA que dependen de material protegido por derechos de autor para entrenar modelos, lo que podría cambiar la forma en que se construyen los modelos de IA.
3. Las empresas de IA podrían pasarse a modelos de “IA con licencia”
Esta decisión podría obligar a los desarrolladores de IA a adoptar conjuntos de datos de entrenamiento con licencia en lugar de extraer texto disponible libremente (pero con derechos de autor). Se espera ver:
- Más asociaciones entre empresas de IA y propietarios de contenidos .
- Costos más altos para las empresas emergentes de IA que ahora deben pagar tarifas de licencia.
- El auge de modelos de IA propietarios con derechos de datos exclusivos, lo que dificulta el ingreso de nuevos competidores al espacio.
4. Un auge potencial de los datos de código abierto y de dominio público
Dado que el uso de contenido exclusivo se vuelve cada vez más riesgoso, las empresas de inteligencia artificial pueden recurrir a datos de acceso abierto . Esto podría dar lugar a lo siguiente:
- La expansión de las bases de datos jurídicas públicas .
- Más inversión en generación de datos sintéticos .
- Un impulso para que los gobiernos hagan que la jurisprudencia y otros materiales jurídicos sean más accesibles .
El panorama más amplio: ¿qué viene a continuación?
El fallo de Thomson Reuters contra ROSS forma parte de una tendencia más amplia en materia de litigios en el ámbito de la IA. En los últimos años, OpenAI, Stability AI y Google han enfrentado demandas judiciales por parte de editores de noticias, autores y artistas. Los tribunales están definiendo ahora los límites del uso legítimo en el ámbito de la IA y el panorama jurídico seguirá evolucionando.
Para los desarrolladores de IA, este caso sirve de advertencia : el contenido protegido por derechos de autor no se puede utilizar libremente solo porque se lo transforme o reformule. Las empresas de IA deben repensar sus estrategias de capacitación y las empresas que dependen de los conocimientos generados por IA deben ser conscientes de los posibles riesgos legales.
Reflexiones finales
La intersección de la IA, los derechos de autor y el uso legítimo se está convirtiendo en uno de los debates jurídicos más importantes de nuestro tiempo. Si bien la tecnología de IA promete innovación y eficiencia, los tribunales están dejando en claro que estos avances deben respetar los derechos de propiedad intelectual. El resultado de este caso probablemente dará forma a las futuras políticas de derechos de autor en materia de IA, y las empresas deberán adaptarse rápidamente para cumplir con las normas.
Mientras los desarrolladores de IA, los profesionales legales y las empresas tecnológicas navegan por estos cambios, una cosa es segura: los días de extraer y resumir datos confidenciales sin consecuencias han terminado .
Fuentes
Para aquellos interesados en leer la sentencia completa del tribunal, se puede acceder al PDF oficial aquí: Documento del tribunal de inteligencia Thomson Reuters v. ROSS
Un análisis adicional sobre el caso y sus implicaciones se puede encontrar en:
WIRED : Demanda por derechos de autor de inteligencia artificial contra Thomson Reuters
The Verge : violación de derechos de autor de Thomson Reuters contra ROSS Intelligence AI
The National Law Review : Tribunal: entrenar un modelo de inteligencia artificial basado en datos protegidos por derechos de autor no es un uso legítimo
Estaremos observando de cerca cómo la IA y las leyes de derechos de autor continúan evolucionando.
-Kobi.