OpenAI n’a jamais révélé exactement quelles données il a utilisées pour entraîner Sora, son IA génératrice de vidéos. Mais à première vue, au moins certaines des données pourraient provenir de flux Twitch et de soluces de jeux.
Sora a été lancé lundi, et je joue un peu avec lui (dans la mesure où les problèmes de capacité le permettront). À partir d’un message texte ou d’une image, Sora peut générer des vidéos d’une durée maximale de 20 secondes dans une gamme de rapports d’aspect et de résolutions.
Lorsque OpenAI a révélé Sora pour la première fois en février, il a fait allusion au fait qu’il avait entraîné le modèle sur des vidéos Minecraft. Alors, je me suis demandé, quels autres jeux vidéo pourraient se cacher dans le kit d’entraînement ?
Pas mal, semble-t-il.
Sora peut générer une vidéo de ce qui est essentiellement un clone de Super Mario Bros. (s’il s’agit d’un glit-off) :
Il peut créer des séquences de jeu d’un jeu de tir à la première personne qui semble inspiré de Call of Duty et Counter-Strike :
Et il peut cracher un clip montrant un combattant d’arcade dans le style d’un jeu Teenage Mutant Ninja Turtle des années 90 :
Sora semble également comprendre à quoi devrait ressembler un flux Twitch, ce qui implique qu’il en a vu quelques-uns. Regardez la capture d’écran ci-dessous, qui donne les bons traits :
Une autre chose remarquable à propos de la capture d’écran : elle présente la ressemblance du populaire streamer Twitch Raúl Álvarez Genes, qui se fait appeler Auronplay – jusqu’au tatouage sur l’avant-bras gauche de Genes.
Auronplay n’est pas le seul streamer Twitch que Sora semble « connaître ». Il a généré une vidéo d’un personnage d’apparence similaire (avec quelques libertés artistiques) à Imane Anys, mieux connue sous le nom de Pokimane.
Certes, j’ai dû faire preuve de créativité avec certaines invites (par exemple, « jeu de plombier italien »). OpenAI a mis en place un filtrage pour essayer d’empêcher Sora de générer des clips représentant des personnages de marque. Taper quelque chose comme « Mortal Kombat 1 gameplay », par exemple, ne donnera rien qui ressemble au titre.
Mais mes tests suggèrent que le contenu du jeu a peut-être trouvé son chemin dans les données d’entraînement de Sora.
OpenAI a été prudent quant à l’origine des données d’entraînement. Dans un interview du Wall Street Journal en mars, Mira Murati, alors directrice technique d’OpenAI, n’a pas nié catégoriquement que Sora avait été formé au contenu de youtube, Instagram et Facebook. Et dans le Caractéristiques techniques pour Sora, OpenAI a reconnu avoir utilisé des données « accessibles au public », ainsi que des données sous licence provenant de bibliothèques multimédias comme Shutterstock, pour développer Sora.
OpenAI n’a pas non plus répondu à une demande de commentaire.
Si le contenu du jeu fait effectivement partie de l’ensemble d’entraînement de Sora, cela pourrait avoir des implications juridiques, en particulier si OpenAI crée des expériences plus interactives sur Sora.
« Les entreprises qui s’entraînent sur des séquences sans licence de jeux vidéo courent de nombreux risques », a déclaré Joshua Weigensberg, avocat en propriété intellectuelle chez Pryor Cashman, à TechCrunch. « L’entraînement d’un modèle d’IA générative implique généralement la copie des données d’entraînement. Si ces données sont des visionnages vidéo de jeux, il est extrêmement probable que des documents protégés par le droit d’auteur soient inclus dans l’ensemble d’entraînement.
Modèles probabilistes
Les modèles d’IA générative comme Sora sont probabilistes. Formés sur de nombreuses données, ils apprennent des modèles dans ces données pour faire des prédictions – par exemple, qu’une personne mordant dans un hamburger laissera une marque de morsure.
Il s’agit d’une propriété utile. Il permet aux modèles d’« apprendre » comment le monde fonctionne, dans une certaine mesure, en l’observant. Mais il peut aussi s’agir d’un talon d’Achille. Lorsqu’ils sont sollicités d’une manière spécifique, les modèles, dont beaucoup sont entraînés sur des données Web publiques, produisent des copies proches de leurs exemples d’entraînement.
Cela a naturellement déplu aux créateurs dont les œuvres ont été balayées en formation sans leur permission. Un nombre croissant d’entre eux cherchent à obtenir réparation par le biais du système judiciaire.
Microsoft et OpenAI sont actuellement en train de Poursuivi pour avoir prétendument permis à leurs outils d’IA de régurgiter du code sous licence. Trois entreprises à l’origine d’applications d’art d’IA populaires, Midjourney, Runway, et Stability AI, sont dans la ligne de mire d’une affaire qui les accuse d’enfreindre les droits des artistes. Et de grandes maisons de disques ont intenté une action en contrefaçon contre deux startups développant des générateurs de chansons alimentés par l’IA, Udio et Suno.
De nombreuses entreprises d’IA revendiquent depuis longtemps des protections d’utilisation équitable, affirmant que leurs modèles créent des œuvres transformatrices – et non plagiaires. Suno fait valoir, par exemple, que l’entraînement sans discernement n’est pas différent d’un « enfant qui écrit ses propres chansons rock après avoir écouté le genre ».
Mais il y a certaines considérations uniques avec le contenu du jeu, explique Evan Everist, avocat chez Dorsey & Whitney spécialisé dans le droit d’auteur.
« Les vidéos de parties impliquent au moins deux niveaux de protection du droit d’auteur : le contenu du jeu tel que détenu par le développeur du jeu, et la vidéo unique créée par le joueur ou le vidéaste capturant l’expérience du joueur », a déclaré Everist à fr.techtribune.netdans un e-mail. Et pour certains jeux, il y a une troisième couche potentielle de droits sous la forme de contenu généré par l’utilisateur apparaissant dans le logiciel.
Everist a donné l’exemple de Fortnite d’Epic, qui permet aux joueurs de créer leurs propres cartes de jeu et de les partager pour que d’autres puissent les utiliser. Une vidéo d’une partie de l’une de ces cartes concernerait pas moins de trois détenteurs de droits d’auteur, a-t-il dit : (1) Epic, (2) la personne qui utilise la carte, et (3) le créateur de la carte.
« Si les tribunaux devaient conclure à la responsabilité du droit d’auteur pour l’entraînement de modèles d’IA, chacun de ces détenteurs de droits d’auteur serait un plaignant potentiel ou une source de licence », a déclaré Everist. « Pour tous les développeurs qui forment l’IA sur de telles vidéos, l’exposition au risque est exponentielle. »
Weigensberg a noté que les jeux eux-mêmes ont de nombreux éléments « protégeables », comme des textures propriétaires, qu’un juge pourrait prendre en compte dans un procès de propriété intellectuelle. « À moins que ces œuvres n’aient été correctement autorisées », a-t-il déclaré, « la formation sur celles-ci peut constituer une infraction ».
fr.techtribune.neta contacté un certain nombre de studios et d’éditeurs de jeux pour obtenir des commentaires, notamment Epic, Microsoft (qui possède Minecraft), Ubisoft, Nintendo, Roblox et le développeur de Cyberpunk CD Projekt Red. Peu ont répondu – et aucun n’a voulu faire de déclaration officielle.
« Nous ne serons pas en mesure de nous impliquer dans une interview pour le moment », a déclaré un porte-parole de CD Projekt Red. EA a déclaré à fr.techtribune.netqu’il « n’avait aucun commentaire pour le moment ».
Sorties risquées
Il est possible que les entreprises d’IA l’emportent dans ces litiges juridiques. Les tribunaux pourraient décider que l’IA générative a un « objectif transformateur très convaincant », suivant le précédent établi il y a une dizaine d’années dans le procès de l’industrie de l’édition contre google.
Dans cette affaire, un tribunal a jugé que la copie par Google de millions de livres pour Google Books, une sorte d’archive numérique, était autorisée. Des auteurs et des éditeurs avaient tenté de faire valoir que la reproduction de leur propriété intellectuelle en ligne constituait une contrefaçon.
Mais une décision en faveur des entreprises d’IA ne protégerait pas nécessairement les utilisateurs des accusations d’actes répréhensibles. Si un modèle génératif régurgitait une œuvre protégée par le droit d’auteur, une personne qui allait ensuite publier cette œuvre – ou l’incorporer dans un autre projet – pourrait toujours être tenue responsable de la violation de la propriété intellectuelle.
« Les systèmes d’IA générative crachent souvent des actifs de propriété intellectuelle reconnaissables et protégeables en sortie », a déclaré M. Weigensberg. « Les systèmes plus simples qui génèrent du texte ou des images statiques ont souvent du mal à empêcher la génération de matériel protégé par le droit d’auteur dans leur sortie, et donc des systèmes plus complexes pourraient bien avoir le même problème, quelles que soient les intentions des programmeurs. »
Certaines entreprises d’IA ont des clauses d’indemnisation pour couvrir ces situations, le cas échéant. Mais les clauses contiennent souvent des exclusions. Par exemple, celui d’OpenAI ne s’applique qu’aux entreprises clientes, et non aux utilisateurs individuels.
Il y a aussi des risques à prendre en compte en plus du droit d’auteur, comme la violation des droits de marque.
« La sortie pourrait également inclure des actifs utilisés dans le cadre du marketing et de l’image de marque – y compris des personnages reconnaissables dans les jeux – ce qui crée un risque de marque », a-t-il déclaré. « Ou le résultat pourrait créer des risques pour les droits de nom, d’image et de ressemblance. »
L’intérêt croissant pour les modèles mondiaux pourrait encore compliquer tout cela. L’une des applications des modèles de monde – qu’OpenAI considère comme Sora – consiste essentiellement à générer des jeux vidéo en temps réel. Si ces jeux « synthétiques » ressemblent au contenu sur lequel le modèle a été formé, cela pourrait être juridiquement problématique.
« Entraîner une plateforme d’IA sur les voix, les mouvements, les personnages, les chansons, les dialogues et les illustrations d’un jeu vidéo constitue une opération de flicune violation de droit, tout comme ce serait le cas si ces éléments étaient utilisés dans d’autres contextes », a déclaré Avery Williams, avocat spécialisé dans les procès en propriété intellectuelle chez McKool Smith. « Les questions autour de l’utilisation équitable qui ont surgi dans tant de poursuites contre les entreprises d’IA générative affecteront l’industrie du jeu vidéo autant que tout autre marché créatif. »