Suivre le rythme d’un secteur aussi en évolution rapide que l’IA est un défi de taille. En attendant qu’une IA puisse le faire à votre place, voici un résumé pratique des histoires de la semaine dernière dans le monde de l’apprentissage automatique, ainsi que des recherches et des expériences notables que nous n’avons pas couvertes seules.

Dans l’une des histoires les plus surprenantes de la semaine dernière, l’autorité italienne de protection des données (DPA) a bloqué le chatbot viral alimenté par l’IA d’OpenAI, ChatGPT, citant des inquiétudes selon lesquelles l’outil enfreint le règlement général sur la protection des données de l’Union européenne. La DPA aurait ouvert une enquête pour déterminer si OpenAI a traité illégalement les données des personnes, ainsi que sur l’absence de tout système empêchant les mineurs d’accéder à la technologie.

On ne sait pas exactement quel pourrait être le résultat ; OpenAI dispose d’un délai de 20 jours pour répondre à la commande. Mais la décision de la DPA pourrait avoir des implications significatives pour les entreprises qui déploient des modèles d’apprentissage automatique, non seulement en Italie, mais partout dans l’Union européenne.

Comme Natasha Dans son article sur l’actualité, note que de nombreux modèles d’OpenAI ont été formés à partir de données récupérées sur Internet, y compris sur des réseaux sociaux comme Twitter et Reddit. En supposant qu’il en soit de même pour ChatGPT, parce que l’entreprise ne semble pas avoir informé les personnes dont elle a réutilisé les données pour entraîner l’IA, elle pourrait bien enfreindre le RGPD dans l’ensemble du bloc.

Le RGPD n’est que l’un des nombreux obstacles juridiques potentiels auxquels l’IA, en particulier l’IA générative (par exemple l’IA génératrice de texte et d’art comme ChatGPT), est confrontée. Il devient de plus en plus clair, à chaque défi croissant, qu’il faudra du temps pour que la poussière retombe. Mais cela ne fait pas peur aux sociétés de capital-risque, qui continuent d’investir des capitaux dans la technologie comme s’il n’y avait pas de lendemain.

Publicité

S’agira-t-il d’investissements judicieux ou de responsabilités ? C’est difficile à dire à l’heure actuelle. Soyez assuré, cependant, que nous rendrons compte de tout ce qui se passera.

Voici les autres titres marquants de l’IA de ces derniers jours :

  • Les publicités arrivent sur Bing Chat : Microsoft a déclaré la semaine dernière qu’il « explorait » l’insertion de publicités dans les réponses fournies par Bing Chat, son agent de recherche alimenté par le modèle de langage GPT-4 d’OpenAI. Comme le note Devin, même si les réponses sponsorisées sont clairement étiquetées comme telles, il s’agit d’une nouvelle forme de publicité potentiellement plus subversive qui peut ne pas être aussi facilement délimitée – ou ignorée. De plus, cela pourrait éroder davantage la confiance dans les modèles linguistiques, qui commettent déjà suffisamment d’erreurs factuelles pour semer le doute sur la véracité de leurs réponses.
  • Une demande de pause : Une lettre comptant plus de 1 100 signataires, dont Elon Musk, publiée mardi, appelle « tous les laboratoires d’IA à suspendre immédiatement pendant au moins six mois la formation de systèmes d’IA plus puissants que GPT-4 ». Mais les circonstances qui l’entourent se sont révélées plus obscures que ce à quoi on aurait pu s’attendre. Dans les jours qui ont suivi, certains signataires ont reculé sur leurs positions tandis que rapport a révélé que d’autres signataires notables, comme le président chinois Xi Jinping, se sont révélés être des faux.
  • Et une réponse à la demande de pause : D’éminents éthiciens de l’IA soulignent que s’inquiéter de problèmes lointains et hypothétiques est dangereux et voué à l’échec si nous ne résolvons pas les problèmes auxquels l’IA contribue aujourd’hui.
  • Twitter dévoile son algorithme : Comme promis à plusieurs reprises par le PDG de Twitter, Elon Musk, Twitter a ouvert une partie de son code source à l’inspection publique, y compris l’algorithme qu’il utilise pour recommander des tweets dans les chronologies des utilisateurs. Il est intéressant de noter que Twitter semble classer les tweets en partie à l’aide d’un réseau neuronal formé en permanence sur les interactions des tweets afin d’optimiser l’engagement positif, comme les likes et les réponses. Mais il y a beaucoup de nuances, comme le des chercheurs creusement dans la note de base de code.
  • Résumer les réunions avec l’IA : Après des entreprises comme Otter et Zoom, un outil de veille sur les réunions Lire a introduit une nouvelle fonctionnalité qui découpe une réunion d’une heure en un clip de deux minutes, accompagné de pointeurs importants. La société affirme utiliser de grands modèles linguistiques – elle n’a pas précisé lesquels – combinés à une analyse vidéo pour sélectionner les parties les plus remarquables de la réunion, une fonctionnalité utile.

Plus d’apprentissages automatiques

Chez le facilitateur d’IA Nvidia, BioNeMo est un exemple de leur nouvelle stratégie, où l’avancée n’est pas tant qu’elle est nouvelle, mais qu’elle est de plus en plus facile d’accès pour les entreprises. La nouvelle version de cette plate-forme biotechnologique ajoute une interface utilisateur Web brillante et un réglage amélioré d’un certain nombre de modèles.

« Une partie croissante des pipelines traitent des tas de données, des quantités que nous n’avons jamais vues auparavant, des centaines de millions de séquences que nous devons alimenter dans ces modèles », a déclaré Peter Grandsard d’Amgen, qui dirige une division de recherche utilisant la technologie de l’IA. « Nous essayons d’obtenir une efficacité opérationnelle autant dans la recherche que dans le secteur manufacturier. Avec l’accélération qu’offre une technologie comme celle de Nvidia, ce que vous auriez pu faire l’année dernière pour un projet, vous pouvez désormais en réaliser cinq ou dix en utilisant le même investissement dans la technologie.

Cet extrait de livre de Meredith Broussard chez Wired vaut la peine d’être lu. Elle était curieuse de connaître un modèle d’IA qui avait été utilisé dans son diagnostic de cancer (elle va bien) et trouvait incroyablement compliqué et frustrant d’essayer de s’approprier et de comprendre ces données et ce processus. Les processus d’IA médicale doivent clairement prendre davantage en compte le patient.

Les applications d’IA réellement néfastes engendrent de nouveaux risques, par exemple en tentant d’influencer le discours. Nous avons vu de quoi GPT-4 est capable, mais la question reste ouverte de savoir si un tel modèle pourrait créer un texte convaincant efficace dans un contexte politique. Cette étude de Stanford le suggère : Lorsque les gens ont été exposés à des essais défendant des arguments tels que le contrôle des armes à feu et les taxes sur le carbone, « les messages générés par l’IA étaient au moins aussi convaincants que les messages générés par l’homme sur tous les sujets ». Ces messages étaient également perçus comme plus logiques et factuels. Le texte généré par l’IA fera-t-il changer d’avis ? Difficile à dire, mais il semble très probable que les gens l’utiliseront de plus en plus pour ce genre d’agenda.

Exemples de textes utilisés pour voir si l’IA peut être convaincante. Crédits images : Université de Stanford

L’apprentissage automatique a été mis à profit par un autre groupe de Stanford pour améliorer simuler le cerveau – comme dans le tissu de l’organe lui-même. Le cerveau n’est pas seulement complexe et hétérogène, mais « un peu comme le Jell-O, ce qui rend les tests et la modélisation des effets physiques sur le cerveau très difficiles », a expliqué le professeur Ellen Kuhl dans un communiqué de presse. Leur nouveau modèle choisit parmi des milliers de méthodes de modélisation cérébrale, les mélangeant et les faisant correspondre pour identifier la meilleure façon d’interpréter ou de projeter à partir des données fournies. Il ne réinvente pas la modélisation des lésions cérébrales, mais devrait rendre toute étude plus rapide et plus efficace.

Dans le monde naturel, une nouvelle approche Fraunhofer de l’imagerie sismique applique le ML à un pipeline de données existant qui gère des téraoctets de sortie des hydrophones et des armes à air comprimé. Normalement, ces données devraient être simplifiées ou abstraites, perdant ainsi une partie de leur précision, mais le nouveau processus basé sur le ML permet l’analyse de l’ensemble de données intégral.

seismic

Crédits images : Fraunhofer

Il est intéressant de noter que les chercheurs notent que cela serait normalement une aubaine pour les sociétés pétrolières et gazières à la recherche de gisements, mais qu’avec l’abandon des combustibles fossiles, cela pourrait être utilisé à des fins plus respectueuses du climat, comme l’identification de CO potentiels.2 sites de séquestration ou accumulations de gaz potentiellement dommageables.

La surveillance des forêts est une autre tâche importante pour la recherche sur le climat et la conservation, et la mesure de la taille des arbres en fait partie. Mais cette tâche implique de vérifier manuellement les arbres un par un. Une équipe de Cambridge a construit un modèle ML qui utilise un capteur lidar de smartphone pour estimer le diamètre du tronc, après l’avoir entraîné sur un ensemble de mesures manuelles. Pointez simplement le téléphone vers les arbres autour de vous et boum. Le système est plus de quatre fois plus rapide, tout en étant précis au-delà de leurs attentes, a déclaré l’auteur principal de l’étude, Amelia Holcomb : « J’ai été surprise que l’application fonctionne aussi bien. Parfois, j’aime le défier avec une partie de forêt particulièrement peuplée ou un arbre de forme particulièrement étrange, et je pense qu’il n’y a aucun moyen d’y parvenir, mais c’est le cas.

Parce qu’il est rapide et ne nécessite aucune formation particulière, l’équipe espère qu’il pourra être largement diffusé afin de collecter des données pour les enquêtes sur les arbres ou de rendre les efforts existants plus rapides et plus faciles. android uniquement pour l’instant.

Enfin, profitez cette enquête et expérience intéressante d’Eigil zu Tage-Ravn de voir ce qu’un modèle d’art génératif fait du célèbre tableau du Spouter-Inn décrit au chapitre 3 de Moby-Dick.

moby dick and AI 6

Crédits images : Examen du domaine public

5/5 - (480 votes)
Publicité
Article précédentL’iPhone 15 obtient l’USB-C, un Cybertruck repensé et la Californie envisage d’interdire les camions AV
Article suivantREVUE : Cordyceps Corn Dog ‘The Last of Us’ aux Halloween Horror Nights 2023 à Universal Studios Hollywood

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici