La bataille juridique entre Thomson Reuters et ROSS Intelligence a provoqué une onde de choc dans les secteurs de l'IA et des technologies juridiques. Le 11 février 2025, le tribunal de district des États-Unis pour le district du Delaware a jugé que ROSS Intelligence avait violé le droit d'auteur de Thomson Reuters en utilisant le contenu éditorial de Westlaw (les notes de tête) pour entraîner son outil de recherche juridique basé sur l'IA. Cette décision a de profondes implications pour le développement de l'IA, en particulier sur la manière dont les entreprises acquièrent et utilisent les données de formation.
Contexte : l’affaire qui a bouleversé le développement de l’IA
Thomson Reuters est propriétaire de Westlaw , une plateforme de recherche juridique de premier plan qui comprend du contenu éditorial exclusif tel que des sommaires (de courts résumés de décisions judiciaires). ROSS Intelligence cherchait à développer un assistant juridique basé sur l'IA et a initialement contacté Thomson Reuters pour un accord de licence. Lorsque Thomson Reuters a refusé, ROSS a obtenu des milliers de Bulk Memos (des résumés de contenu Westlaw créés par des sous-traitants tiers) pour former son modèle d'IA.
Thomson Reuters a fait valoir que même si ROSS n'avait pas directement copié les notes de service de Westlaw, la nature dérivée des Bulk Memos constituait néanmoins une violation du droit d'auteur. Le tribunal a accepté cette position, rejetant la défense d'utilisation équitable de ROSS et renforçant les protections du droit d'auteur pour le contenu juridique organisé.
Pourquoi cette affaire est importante pour l’IA et le droit d’auteur
Cette décision constitue un précédent juridique majeur qui pourrait façonner l'avenir du développement de l'IA. Voici pourquoi :
1. Application plus stricte du droit d'auteur sur les données de formation de l'IA
Les entreprises d’IA ont longtemps eu recours à l’extraction et à l’analyse de vastes quantités de données textuelles, souvent issues de livres, d’articles de presse et de bases de données en ligne. Cette décision précise clairement que :
- Même le contenu dérivé basé sur du matériel protégé par le droit d’auteur peut être considéré comme une contrefaçon.
- Les startups d’IA doivent obtenir des licences explicites avant d’utiliser des données propriétaires.
- Des entreprises comme Westlaw, Bloomberg et les éditeurs scientifiques pourraient renforcer les restrictions sur leur contenu.
2. Les limites de l’utilisation équitable dans l’IA
ROSS a fait valoir que son utilisation de résumés juridiques relevait de l'usage équitable , une défense qui autorise une utilisation limitée de matériel protégé par le droit d'auteur à des fins telles que la recherche et l'éducation. Cependant, le tribunal a statué que :
- L’utilisation des notes de tête par l’IA était commerciale et compétitive .
- Les données ont été transformées, mais pas suffisamment pour être considérées comme une utilisation équitable.
- Le simple fait de résumer ou de reformuler un contenu protégé par le droit d’auteur ne le rend pas automatiquement libre d’utilisation .
Cela suscite des inquiétudes chez les développeurs d’IA qui s’appuient sur du matériel protégé par le droit d’auteur pour former des modèles, ce qui pourrait remodeler la manière dont les modèles d’IA sont construits.
3. Les entreprises d’IA pourraient passer à des modèles d’« IA sous licence »
Cette décision pourrait forcer les développeurs d'IA à adopter des ensembles de données de formation sous licence au lieu de récupérer des textes librement disponibles (mais protégés par le droit d'auteur). Attendez-vous à voir :
- Davantage de partenariats entre les entreprises d’IA et les propriétaires de contenu .
- Des coûts plus élevés pour les startups d’IA qui doivent désormais payer des frais de licence.
- L’essor des modèles d’IA propriétaires dotés de droits de données exclusifs rend plus difficile l’entrée de nouveaux concurrents dans l’espace.
4. Un boom potentiel des données open source et du domaine public
Les contenus propriétaires devenant de plus en plus risqués à utiliser, les entreprises d'IA pourraient se tourner vers des données en accès libre . Cela pourrait conduire à :
- L'expansion des bases de données juridiques publiques .
- Plus d’investissement dans la génération de données synthétiques .
- Un effort pour que les gouvernements rendent la jurisprudence et les autres documents juridiques plus accessibles .
La vue d’ensemble : quelle est la prochaine étape ?
L’arrêt Thomson Reuters c. ROSS s’inscrit dans une tendance plus large en matière de litiges liés à l’IA. Ces dernières années, OpenAI, Stability AI et Google ont dû faire face à des contestations judiciaires de la part d’éditeurs de presse, d’auteurs et d’artistes. Les tribunaux définissent désormais les limites de l’utilisation équitable dans le domaine de l’IA , et le paysage juridique continuera d’évoluer.
Pour les développeurs d'IA, cette affaire constitue un avertissement : un contenu protégé par le droit d'auteur ne peut pas être utilisé librement simplement parce qu'il a été transformé ou reformulé. Les entreprises d'IA doivent repenser leurs stratégies de formation , et les entreprises qui s'appuient sur des informations générées par l'IA doivent être conscientes des risques juridiques potentiels.
Réflexions finales
L’intersection entre l’IA, le droit d’auteur et l’usage équitable est en passe de devenir l’un des débats juridiques les plus importants de notre époque. Si l’IA promet innovation et efficacité, les tribunaux indiquent clairement que ces avancées doivent respecter les droits de propriété intellectuelle. L’issue de cette affaire façonnera probablement les futures politiques de droit d’auteur en matière d’IA, et les entreprises devront s’adapter rapidement pour rester en conformité.
Alors que les développeurs d’IA, les professionnels du droit et les entreprises technologiques s’adaptent à ces changements, une chose est sûre : l’époque où l’ on pouvait extraire et résumer des données propriétaires sans conséquences est révolue .
Sources
Pour ceux qui souhaitent lire l'intégralité de la décision du tribunal, le PDF officiel est accessible ici : Thomson Reuters v. ROSS Intelligence Court Document
Des analyses supplémentaires sur l’affaire et ses implications peuvent être trouvées dans :
WIRED : Procès contre Thomson Reuters pour atteinte aux droits d'auteur sur l'IA
The Verge : Violation du droit d'auteur dans l'affaire Thomson Reuters contre ROSS Intelligence AI
Revue nationale de droit : Cour : la formation d'un modèle d'IA basé sur des données protégées par le droit d'auteur n'est pas une utilisation équitable
Nous surveillerons de près l’évolution de l’IA et du droit d’auteur.
-Kobi.