Les querelles juridiques entre les artistes et les entreprises qui forment l’IA sur leurs œuvres ne montrent aucun signe de ralentissement.

En l’espace de quelques mois, plusieurs poursuites ont été intentées contre la technologie d’IA générative d’entreprises telles que OpenAI et Stability AI, intentées par des plaignants qui allèguent que des données protégées par le droit d’auteur – principalement de l’art – ont été utilisées sans leur permission pour former les modèles génératifs. Les modèles d’IA générative « apprennent » à créer de l’art, du code et plus encore en « s’entraînant » sur des exemples d’images et de texte, généralement récupérés sans discernement sur le Web.

Dans le but d’accorder aux artistes plus de contrôle sur la manière et le lieu d’utilisation de leur art, Jordan Meyer et Mathew Dryhurst ont cofondé la startup IA de frai. Spawning a créé HaveIBeenTrained, un site Web qui permet aux créateurs de se retirer de l’ensemble de données de formation pour un modèle d’IA générant de l’art, Stable Diffusion v3, qui doit être publié dans les mois à venir.

En mars, les artistes avaient utilisé HaveIBeenTrained pour supprimer 80 millions d’œuvres d’art de l’ensemble de formation Stable Diffusion. Fin avril, ce chiffre avait dépassé le milliard.

Au fur et à mesure que la demande pour le service de Spawning augmentait, l’entreprise – qui était entièrement amorcée jusque-là – a recherché un investissement extérieur. Et ça l’a eu. Spawning a annoncé aujourd’hui avoir levé 3 millions de dollars lors d’un tour de table mené par True Ventures avec la participation de Seed Club Ventures, Abhay Parasnis, Charles Songhurst, Balaji Srinivisan, Jacob.eth et Noise DAO.

Publicité

S’adressant à fr.techtribune.net par e-mail, Meyer a déclaré que le financement permettra à Spawning de continuer à développer « des normes IP pour le IA époque » et établir des normes d’opt-out et d’opt-in plus robustes.

« Nous sommes enthousiasmés par le potentiel de IA outillage. Nous avons développé une expertise de domaine dans le domaine en étant passionnés par de nouvelles opportunités IA fournit aux créateurs, mais je pense que le consentement est une couche fondamentale pour faire de ces développements quelque chose dont tout le monde peut se sentir bien », a déclaré Meyer.

Les paramètres de frai parlent d’eux-mêmes. De toute évidence, il y a une demande des artistes pour avoir plus leur mot à dire sur la façon dont leur art est utilisé (ou gratté, selon le cas). Mais au-delà des partenariats avec des plateformes d’art comme Shutterstock et ArtStation, Spawning n’a pas réussi à rallier l’industrie autour d’une norme commune d’exclusion ou de provenance.

Adobe, qui a récemment annoncé des outils d’IA générative, poursuit ses propres mécanismes et outils de désactivation. Il en va de même pour DeviantArt, qui a lancé en novembre une protection qui s’appuie sur des balises HTML pour interdire aux robots logiciels qui parcourent les pages à la recherche d’images de Télécharger ces images pour les ensembles de formation. OpenAI, le géant de l’IA générative dans la salle, n’offre toujours pas d’outil de désactivation – et n’a pas non plus annoncé son intention de le faire de si tôt.

Le frai a également été critiqué pour l’opacité – et le flou – de son processus de désactivation. Comme Ars Technica indiqué dans un article récent, le processus de désinscription ne semble pas correspondre à la définition du consentement à l’utilisation des données personnelles dans le règlement général européen sur la protection des données, qui stipule que le consentement doit être donné activement, et non supposé par défaut. On ne sait pas non plus comment Spawning a l’intention de vérifier légalement l’identité des artistes qui font des demandes de retrait – ou même, s’il a l’intention de tenter cela du tout.

La solution du frai est à plusieurs volets. Premièrement, il prévoit de permettre aux formateurs de modèles d’IA d’honorer plus facilement les demandes de désinscription et de rationaliser le processus pour les créateurs. Ensuite, Spawning offrira plus de services aux organisations cherchant à protéger le travail de leurs artistes, dit Meyer.

« Nous voulons construire la couche de consentement pour l’IA, qui, selon nous, sera un élément d’infrastructure fondamentalement utile pour aller de l’avant », a-t-il ajouté. « Nous prévoyons de grandir Frai pour aborder les nombreux domaines différents touchés par la IA économique, car chaque domaine a ses besoins particuliers.

Dans une première étape vers cette vision ambitieuse, Spawning in March a activé les « désactivations de domaine », permettant aux créateurs et aux partenaires de contenu de désactiver rapidement le contenu de sites Web entiers. Spawning indique que 30 000 domaines à ce jour ont été enregistrés dans le système.

Avoir Été Formé

L’outil de Spawning permet aux artistes de se retirer de la formation à l’IA générative. Crédits image : Frai

Avril marquera la sortie d’une API et d’un package Python open source qui élargiront considérablement l’étendue du contenu que Spawning touche. Auparavant, les demandes de désactivation via Spawning ne s’appliquaient qu’à l’ensemble de données LAION-5B – l’ensemble de données utilisé pour former Stable Diffusion. À partir d’avril, tout site Web, application ou service pourra utiliser l’API de Spawning pour se conformer automatiquement aux désinscriptions non seulement pour les données d’image, mais aussi pour le texte, l’audio, les vidéos et plus encore.

Meyer dit que Spawning regroupera toutes les nouvelles méthodes de désinscription (par exemple celles d’Adobe et de DeviantArt) dans son package Python pour les formateurs de modèles, dans le but de réduire le nombre de comptes que les créateurs de modèles doivent gérer pour se conformer aux demandes de désinscription.

Pour augmenter la visibilité, Spawning s’associe à Hugging Face, l’une des plus grandes plates-formes d’hébergement et d’exécution de modèles d’IA, pour ajouter une nouvelle boîte d’informations sur Hugging Face qui alertera les utilisateurs de la proportion de données « désactivées » dans le texte. aux ensembles de données d’image. La boîte sera également liée à une page d’inscription à l’API Spawning afin que les formateurs de modèles puissent supprimer les images désactivées au moment de la formation.

« Nous pensons qu’une fois que les entreprises et les développeurs savent que l’option d’honorer les souhaits des créateurs est disponible, il n’y a aucune raison de ne pas les honorer », a déclaré Meyer. « Nous sommes enthousiasmés par l’avenir de la génération IAmais les créateurs et les organisations ont besoin de normes en place pour que leurs données fonctionnent en leur faveur. »

Pour l’avenir, Spawning a l’intention de publier une fonction de détection de « doublon exact » pour faire correspondre les images désactivées avec des copies que la plate-forme trouve sur le Web, suivie d’une fonction de détection de « quasi-double » pour informer les artistes lorsque Spawning trouve des copies probables de leur travail qui a été recadré, compressé ou autrement légèrement modifié.

Au-delà de cela, il est prévu une extension chrome pour permettre aux créateurs de désactiver de manière préventive leur travail publié n’importe où sur le Web et une recherche de légendes sur le site Web HaveIBeenTrained pour rechercher directement les descriptions d’images. L’outil de recherche actuel du site utilise uniquement des correspondances approximatives entre le texte et les images ainsi que des recherches d’URL pour trouver du contenu hébergé sur des sites Web spécifiques.

Spawning – désormais redevable aux investisseurs – prévoit de gagner de l’argent en créant des services en plus de son infrastructure de contenu, bien que Meyer ne divulgue pas grand-chose. Reste à savoir comment cela se passera avec les créateurs de contenu.

« Nous avons parlé à un certain nombre d’organisations, de nombreuses conversations étant trop prématurées pour être annoncées, et pensons que notre annonce de financement et notre visibilité accrue contribueront dans une certaine mesure à offrir l’assurance que ce que nous construisons est une norme solide et fiable avec laquelle travailler. « , a déclaré Meyer. « Après avoir terminé ces fonctionnalités, nous commencerons à créer une infrastructure pour prendre en charge davantage d’ensembles de données, y compris la musique, la vidéo et le texte. »

4.7/5 - (29 votes)
Publicité
Article précédentLes téléviseurs intelligents The Frame 2022 de Samsung sont jusqu’à 33% de réduction
Article suivantLe portefeuille de Samsung Gaming Hub s’étend à près de 3000 jeux avec le lancement d’Antstream Arcade et de Blacknut
Berthe Lefurgey
Berthe Lefurgey est une journaliste chevronnée, passionnée par la technologie et l'innovation, qui fait actuellement ses armes en tant que rédactrice de premier plan pour TechTribune France. Avec une carrière de plus de dix ans dans le monde du journalisme technologique, Berthe s'est imposée comme une voix de confiance dans l'industrie. Pour en savoir plus sur elle, cliquez ici. Pour la contacter cliquez ici

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici