GARY MARCUS AND REID SOUTHEN - IA et copyright
Accueil » IA générative : Midjourney et DALL-E face au copyright

IA générative : Midjourney et DALL-E face au copyright

Cet article est également disponible en: Anglais

Avec l’essor des IA génératives, de nombreuses questions éthiques et légales se posent. Si de nombreuses entreprises sont tentées de les adopter, deux problèmes majeurs existent.
D’une part, les données d’entraînement des IA sont dans bien des cas des visuels aspirés en masse sur Internet, sans se soucier du droit d’auteur/copyright.
D’autre part, rien ne dit que les images issues des IA ne vont pas poser elles-mêmes des problème de copyright, en générant par exemple des images comportant des éléments trop proches des données sources non libres de droits.

Midjourney génère du Marvel : que feront les studios ?

Ce dernier point se confirme avec Midjourney. Des tests montrent que cet outil permet par exemple de recréer des frames de films Marvel, quasiment à l’identique et sans réelle difficulté.
Gary Marcus et Reid Southen ont publié une enquête sur leurs expérimentations. Ils montrent que des prompts assez basiques permettent de générer des images quasi identiques à celles de films, jeux vidéo.

Jugez plutôt : l’illustration d’en-tête de cet article, et les images qui suivent, montrent ce que permet de créer la V6 de Midjourney.
D’un point de vue du droit d’auteur, utiliser commercialement ces résultats exposerait un utilisateur de Midjourney à une plainte pour contrefaçon.

IA générative & copyright
Source : Generative AI Has a Visual Plagiarism Problem

Evidemment, on peut souligner que ces prompts citent explicitement les titres des oeuvres ciblées. Et on pourrait donc supposer qu’à l’inverse, un utilisateur lambda ne citant pas de titre ne tombera pas sur ce genre de résultat et n’encourra aucun risque. Mais les deux auteurs de l’enquête montrent que le problème survient même via des requêtes ne faisant pas directement allusion au nom d’une licence.

IA générative & copyright
Source : Generative AI Has a Visual Plagiarism Problem

Le problème existe aussi avec DALL-E 3, autre IA générative :

IA générative & copyright
Source : Generative AI Has a Visual Plagiarism Problem

Ces recherches montrent qu’un problème bien réel existe, et le Hollywood Reporter, qui a demandé l’avis d’avocats américains spécialistes en propriété intellectuelle, explique sans surprise qu’il est très probable que des films entiers (ou a minima des images promotionnelles, bandes annonces) ont servi à entraîner Midjourney, a priori sans la moindre autorisation.
Pire encore : si ces exemples sont des oeuvres connues, le problème se pose aussi pour des images et photos que l’utilisateur final ne reconnaîtra pas du premier coup d’oeil. Il risque donc d’enfreindre le copyright d’une oeuvre sans le réaliser.

Gary Marcus et Reid Southen soulignent dans leur enquête que pour les entreprises derrière les outils d’IA générative, faire un « patch » est très difficile : filtrer des mots clés laisse la place à des voies de contournement souvent assez simples, et ré-entraîner une IA est très coûteux. Les recherches visant à faire « désapprendre » des éléments spécifiques existent, mais pour l’heure, il n’y a pas de solution miracle. Surtout pour des IA ayant manifestement été entraînées sur un grand nombre d’images non libres de droit.

Nous vous invitons fortement à lire l’article complet du Hollywood Reporter si la partie judiciaire vous intéresse. Le média se demande en particulier pourquoi aucun procès retentissant n’a eu lieu, et propose quelques hypothèses : les studios seraient peut-être en train de négocier un accord avec les sociétés d’IA, dans le but de leur faire payer une licence d’utilisation. Les données pourraient alors servir à l’entraînement, contre rémunération.
Autre possibilité, les studios patientent tout en accumulant les preuves, tout en regardant l’avancée des premières actions en justice. L’enquête évoquée ci-dessus serait alors exactement le genre d’élément que les studios pourraient utiliser afin d’étayer une plainte. Notons d’ailleurs qu’une menace de procès peut aussi être un moyen de forcer les sociétés spécialisées dans l’IA à accepter de signer un accord avec licence d’utilisation payante.

Autrement dit, nous en saurons plus dans les semaines ou mois à venir sur la stratégie des studios face aux évolutions des IA génératives. Nous aurons donc l’occasion de vous en reparler.

D’ici là, nous vous invitons à découvrir, si ce n’est déjà fait, la conférence sur les IA génératives proposée fin 2023 aux RADI-RAF. A partir de 24 minutes 43, Quentin Auger (Co-fondateur et Head of Innovation – Dada ! Animation) aborde justement l’aspect légal de ces outils.

Laissez un commentaire

A Lire également