C’est avec un grand plaisir que le médiaClub vous partage le 4eme numéro de «vendredi de l’IP-IT» du département Media-Cinéma-Digital du cabinet Spring Legal. C’est un billet publié chaque semaine, écrit à chaque fois par un membre différent de l’équipe, aujourd’hui c’est au tour de Julien Brunet (Avocat Associé chez Spring Legal). Les écrits auront toujours trait à une question de droit liée aux préoccupations du monde de la propriété intellectuelle (IP) et de la Tech (IT).
Suivez aussi la page Spring Legal sur linkedin.
L’ARSENAL JURIDIQUE DES ÉDITEURS DE PRESSE FACE AUX IA
Face à l’émergence des intelligences artificielles (IA), notamment génératives, les éditeurs de presse se questionnent sur la réponse appropriée à apporter pour protéger leurs intérêts. Ils disposent d’un arsenal législatif bien garni pour les aider dans leur réflexion.
De quoi parle-t-on ? Les IA génératives, types ChatGPT, fonctionnent en utilisant des modèles d’apprentissage automatique (modèle Machine Learning) pour créer du contenu de manière autonome. L’une des techniques les plus couramment utilisées en IA générative est l’utilisation de réseaux de neurones artificiels récurrents (RNN), ces derniers étant le plus souvent utilisés pour générer du texte ou de la musique. C’est là tout le problème. Pour générer du texte (ou des images), il faut alimenter ces IA génératives en data, principalement des pages de sites internet. Ainsi, si l’on demande à ChatGPT de rédiger un article sur la crise du logement à Paris, via un prompt (court texte permettant de diriger une IA pour qu’elle crée une image ou un texte) précis du type « Analysez la crise du logement à Paris à partir des récents dossiers du Journal de l’immobilier », ChatGPT va utiliser en réponse son modèle reprenant notamment les contenus « scrapés » sur le site visé. Aussi, plusieurs techniques se cachent derrière cette méthodologie visant à nourrir les IA génératives en contenus, notamment le data crawling consistant à utiliser des programmes automatisés ou robots pour indexer le contenu et les informations d’une page internet, et le data scraping impliquant une extraction automatique des données pour les réutiliser dans un autre contexte.
S’il n’existe à l’heure actuelle aucun règlement promulgué abordant spécifiquement la question de l’IA dans I’UE, la Commission a présenté en 2021 une proposition de règlement du Parlement européen et du Conseil établissant des règles harmonisées concernant l’IA. Le 8 décembre 2023, le Parlement européen et le Conseil de l’UE ont trouvé un accord sur ce texte qui sera la première loi sur l’intelligence artificielle dans le monde. Mais pour l’heure, afin de se prémunir du data crawling et du data scraping réalisés par les bots à leur insu, les éditeurs de presse doivent composer avec un arsenal législatif étoffé, comprenant l’atteinte au droit des producteurs de bases de données, la concurrence parasitaire et/ou concurrence déloyale, la violation contractuelle (CGU/ CGV), la contrefaçon de droit d’auteur ou encore la protection des données à caractère personnel.
Pour rappel, la directive européenne du 17 avril 2019 a introduit une nouvelle exception au droit d’auteur en autorisant la fouille de textes et de données, y compris à des fins commerciales, dès lors qu’un contenu est librement accessible sur internet. Toutefois, cette exception est couplée à l’« opt out », la faculté pour les ayants droit de s’y opposer. Le décret du 23 juin 2022, qui transpose la directive européenne dans la loi française, précise qu’il n’a pas à être motivé et peut être exprimé « au moyen de procédés lisibles par machine, y compris des métadonnées, et par le recours à des conditions générales d’utilisation d’un site internet ou d’un service. »
Nul doute que les mois à venir seront riches sur le plan judiciaire. Pas plus tard qu’il y a deux jours, le New York Times a officiellement porté plainte contre ChatGPT, et contre Microsoft, son principal actionnaire, en l’accusant d’avoir utilisé, sans aucune autorisation ni rémunération, des millions d’articles pour entraîner ses grands modèles de langage GPT. Sont ainsi réclamés des milliards de dollars de dommages-intérêts à OpenAl ainsi que la mise hors ligne des modèles alimentés par ses contenus. Pour autant, ne doit-on pas y voir un terrain fertile à des accords commerciaux autorisant la reprise d’articles sous licence?