Dans le contexte: Les transformateurs génératifs pré-formés (GPT) comme ceux utilisés dans le chatbot ChatGPT d’OpenAI et le générateur d’images Dall-E sont la tendance actuelle dans la recherche sur l’IA. Tout le monde veut appliquer les modèles GPT à presque tout, et cela a soulevé une controverse considérable pour diverses raisons.
Scientific American note qu’un groupe de chercheurs a développé un modèle GPT capable de lire dans l’esprit d’un humain. Le programme n’est pas différent de ChatGPT en ce sens qu’il peut générer un langage cohérent et continu à partir d’une invite. La principale différence est que l’invite est l’activité cérébrale humaine.
L’équipe de l’Université du Texas à Austin vient publié son étude dans Nature Neuroscience lundi. La méthode utilise l’imagerie d’une machine IRMf pour interpréter ce que le sujet « entend, dit ou imagine ». Les scientifiques appellent la technique « non invasive », ce qui est ironique puisque lire les pensées de quelqu’un est à peu près aussi invasif que possible.
Cependant, l’équipe veut dire que sa méthode n’est pas médicalement invasive. Ce n’est pas la seule fois que des scientifiques ont développé une technologie capable de lire les pensées, mais c’est la seule méthode réussie qui ne nécessite pas d’électrodes connectées au cerveau du sujet.
nous avons formé et testé notre décodeur sur les réponses cérébrales pendant que les sujets écoutaient des histoires narratives naturelles. étant donné les réponses cérébrales à de nouvelles histoires qui n’ont pas été utilisées dans la formation, le décodeur a réussi à récupérer le sens des histoires (3/7) pic.twitter.com/HmJDIB36WM
– Jerry Tang (@jerryptang) 30 septembre 2022
Le modèle, surnommé sans imagination GPT-1, est la seule méthode qui interprète l’activité cérébrale dans un format de langage continu. D’autres techniques peuvent cracher un mot ou une courte phrase, mais GPT-1 peut former des descriptions complexes qui expliquent l’essentiel de ce que le sujet pense.
Par exemple, un participant a écouté un enregistrement d’une personne déclarant : « Je n’ai pas encore mon permis de conduire ». Le modèle de langage a interprété l’imagerie IRMf comme signifiant : « Elle n’a même pas encore commencé à apprendre à conduire ». Ainsi, bien qu’il ne lise pas textuellement les pensées de la personne, il peut se faire une idée générale et la résumer.
Les méthodes invasives peuvent interpréter des mots exacts car elles sont entraînées à reconnaître des fonctions motrices physiques spécifiques dans le cerveau, telles que le mouvement des lèvres pour former un mot. Le modèle GPT-1 détermine sa sortie en fonction du flux sanguin dans le cerveau. Il ne peut pas répéter précisément les pensées car il fonctionne à un niveau supérieur de fonctionnement neurologique.
« Notre système fonctionne à un niveau très différent », a déclaré le professeur adjoint Alexander Huth du centre de neurosciences et d’informatique de l’UT Austin lors d’un point de presse jeudi dernier. « Au lieu de regarder cette chose motrice de bas niveau, notre système fonctionne vraiment au niveau des idées, de la sémantique et du sens. C’est là où il veut en venir. »
Lisez aussi: Des esprits technologiques de premier plan signent une lettre ouverte demandant une pause de six mois sur le développement avancé de l’IA
La percée est survenue après avoir alimenté les commentaires GPT-1 Reddit et les comptes « autobiographiques ». Ensuite, ils l’ont formé sur les scans de trois volontaires qui ont passé 16 heures chacun à écouter des histoires enregistrées dans la machine IRMf. Cela a permis à GPT-1 de lier l’activité neuronale aux mots et aux idées dans les enregistrements.
Une fois formés, les volontaires ont écouté de nouvelles histoires tout en étant scannés, et GPT-1 a déterminé avec précision l’idée générale de ce que les participants entendaient. L’étude a également utilisé des films muets et l’imagination des volontaires pour tester la technologie avec des résultats similaires.
Fait intéressant, GPT-1 était plus précis lors de l’interprétation des sessions d’enregistrement audio que les histoires inventées par les participants. On pourrait attribuer cela à la nature abstraite des pensées imaginées par rapport aux idées plus concrètes formées en écoutant quelque chose. Cela dit, GPT-1 était encore assez proche lors de la lecture de pensées non exprimées.
le même décodeur a également travaillé sur les réponses cérébrales tandis que les sujets imaginaient raconter des histoires, même si le décodeur n’était entraîné que sur des données de parole perçues. nous nous attendons à ce que la formation du décodeur sur certaines données vocales imaginaires améliore encore les performances (4/7) pic.twitter.com/z63D7Xe3Sa
– Jerry Tang (@jerryptang) 30 septembre 2022
Dans un exemple, le sujet a imaginé, « [I] est allé sur un chemin de terre à travers un champ de blé et au-dessus d’un ruisseau et par des bâtiments en rondins. » Le modèle a interprété cela comme « Il a dû traverser un pont de l’autre côté et un très grand bâtiment au loin. » Donc, il a manqué certains détails sans doute essentiels et un contexte vital, mais a quand même saisi des éléments de la pensée de la personne.
Les machines capables de lire les pensées pourraient être la forme de technologie GPT la plus controversée à ce jour. Bien que l’équipe envisage la technologie pour aider les patients atteints de SLA ou d’aphasie à parler, elle reconnaît son potentiel d’utilisation abusive. Il nécessite le consentement du sujet pour fonctionner sous sa forme actuelle, mais l’étude admet que de mauvais acteurs pourraient créer une version qui annule cette vérification.
« Notre analyse de la confidentialité suggère que la coopération des sujets est actuellement requise à la fois pour former et pour appliquer le décodeur », lit-on. « Cependant, les développements futurs pourraient permettre aux décodeurs de contourner ces exigences. De plus, même si les prédictions des décodeurs sont inexactes sans la coopération du sujet, elles pourraient être intentionnellement mal interprétées à des fins malveillantes. Pour ces raisons et d’autres imprévues, il est essentiel de sensibiliser aux risques. de la technologie de décodage cérébral et adopter des politiques qui protègent la vie privée mentale de chacun. »
Bien sûr, ce scénario suppose que la technologie IRMf peut être suffisamment miniaturisée pour être pratique en dehors d’un cadre clinique. Toutes les applications autres que la recherche sont encore loin.