De quoi parle-t-on quand on parle d’opt out en matière d’IA ?
TOC Example

La contrathèque
Accédez gratuitement à nos modèles de contrats et templates
On entend beaucoup parler de la notion d’opt out quand on parle d’IA. De quoi s’agit-il exactement?
On rappelle ce grand classique : entraîner une IA nécessite des données. Beaucoup de données. Or ces données peuvent être protégées par différents types de droits, notamment du droit d’auteur. En théorie, il faudrait donc l’accord de chacun des auteurs pour faire cette utilisation de leurs œuvres. Ce qui n’est évidemment pas réaliste.
On est alors allé exhumer de la directive européenne sur le droit d’auteur de 2019 l’exception de text and data mining (en français : fouille de textes et de données, transposée à l’article L122-5 CPI )
Comment est-ce que ça fonctionne?
Le texte prévoit que, par exception au droit d’auteur, il est possible de réaliser des reproductions et des extractions d'œuvres et d'autres objets protégés, accessibles de manière licite, aux fins de la fouille de textes et de données:
- Soit à des fins de recherche scientifique,
- Soit pour toute finalité, à condition que le titulaire des droits n’ait pas expressément indiqué qu’il refusait cet usage. C’est-à-dire à condition qu’il n’ait pas exercé le fameux opt out.
S’agissant des modalités de l’opt out, le texte prévoit qu’il doit être exercé au moyen de “procédés lisibles par machine”. Des questions se posent quant à la mise en œuvre pratique de cette disposition, dont nous parlerons dans la prochaine newsletter. Il pourra s’agir par exemple d’informations figurant dans les métadonnées, ou encore dans les conditions générales d'utilisation du site internet ou du service (expressément visées comme un “procédé lisible par machine” par le considérant 18 de la directive de 2019).
Est-ce que cette exception peut être invoquée pour entraîner les modèles d’IA?
Le Règlement européen sur l’IA (“RIA”) semble l’admettre car il mentionne, parmi les obligations des fournisseurs de modèle d’IA à usage général, qu’ils doivent mettre en place, “y compris au moyen de technologies de pointe” l’opt out prévu par la directive de 2019 (art 53.1. c) du RIA.
Deux conditions doivent alors être remplies pour qu’un fournisseur d’IA puisse se prévaloir de l’exception de fouille de textes et de données :
- un accès aux données de manière licite : ce sera le cas s’agissant des contenus librement accessibles, ou encore qui sont accessibles grâce à un accord contractuel, par exemple un abonnement.
- l’absence d’opt out sur les données.
Certains organismes ont déjà communiqué sur l’exercice de leur droit d’opt-out, par exemple :
👉Le Monde interdit explicitement l’utilisation de ses contenus pour entraîner des modèles d’IA dans ses conditions générales : “Il est en outre strictement interdit, sans l'accord préalable et écrit du Monde, de crawler le Site et/ou les Applications et/ou d'en collecter de manière massive le contenu, par quelque moyen et dans quelque but que ce soit, et en particulier afin de développer ou d'entraîner tout programme logiciel, y compris, sans s'y limiter, les programmes basés sur l'intelligence artificielle.”
👉La Sacem a déclaré exercer son droit d’opposition au profit de ses membres. Elle précise que les “entités qui utilisent les oeuvres de la SACEM pour alimenter leurs bases d'entraînement et réaliser des activités de fouilles de données à partir de celles-ci devront demander à la SACEM une autorisation préalable et négocier expressément les conditions de cette exploitation.”
En pratique, plusieurs questions se posent quant à la mise en œuvre de l’opt out. Nous en parlons dans la prochaine newsletter, stay tuned.
L'abonnement juridique illimité pour les entrepreneurs
Fonds publics, conflit d'associés, mise en conformité RGPD, M&A, contentieux : découvrez toutes nos offres conçues pour les startups.