Hristo Georgiev a récemment reçu un message troublant d’un ami : Google dit qu’il est un tueur en série. Si vous cherchiez son nom sur Google, le moteur de recherche vous servirait Le portrait professionnel de Georgiev à côté d’un article de Wikipedia sur un tueur en série bulgare du même nom décédé en 1980. C’est une erreur regrettable, mais ce n’est pas non plus la première fois que les algorithmes de Google font quelque chose comme ça.
L’article de Wikipédia qui a fait surface dans les résultats de Georgiev n’incluait pas sa photo dans la tête, et si vous lisez attentivement, vous apprendrez rapidement que le tueur en série éponyme est mort par un peloton d’exécution il y a des décennies. Pourtant, les systèmes automatisés de Google avaient donné à Georgiev, un ingénieur logiciel basé en Suisse, l’apparence de quelqu’un qu’il n’était pas. Les algorithmes de l’entreprise avaient déposé les informations dans l’un de ses « panneaux de connaissances », les petites cases qui apparaissent en haut des résultats du moteur de recherche et sont censées offrir une réponse rapide et faisant autorité aux requêtes de recherche afin que vous n’ayez pas à cliquer dessus. sur les résultats. Mais puisque Google a fait ses débuts avec ces panneaux en 2012, ils ont à plusieurs reprises promu la désinformation.
Il a fallu quelques heures à Google pour résoudre le problème après que plusieurs personnes l’ont signalé et cela a attiré l’attention sur le forum Web Hacker News, a déclaré Georgiev à Recode. Pourtant, il dit que le mauvais résultat, qui a peut-être été en place pendant des semaines, l’a fait se sentir au moins « un peu mal à l’aise ». Il a rappelé qu’une personne qui avait recherché son nom avait eu une « mini crise cardiaque » momentanée.
Le problème qui a conduit aux résultats incorrects de Georgiev peut être attribué au Knowledge Graph de Google, que le moteur de recherche appels une encyclopédie virtuelle géante des faits. « L’organisation de milliards d’entités dans notre Knowledge Graph nécessite que nous utilisions des systèmes automatisés, qui fonctionnent souvent bien mais ne sont pas parfaits », a déclaré un porte-parole de Google à Recode. « Nous sommes désolés pour les problèmes causés par cette confusion. »
Google a un processus formel pour signaler et supprimer les informations inexactes dans ses panneaux de connaissances, mais il repose en grande partie sur les utilisateurs pour détecter tout problème. Cela laisse les utilisateurs responsables de remarquer si Google fait apparaître des informations incorrectes à leur sujet dans ses premiers résultats de recherche, puis de signaler l’erreur à la plate-forme de recherche.L’entreprise a lancé un système permettant aux organisations et aux personnes de vérifier leur identité auprès de Google afin qu’elles puissent plus facilement fournir rétroaction directe à Google sur l’exactitude de la fiche info qui les concerne.
Pourtant, dans le passé, des personnes se sont plaintes que la suppression de fausses informations de ces panneaux était un processus fastidieux, et d’autres ont déclaré que cela pouvait prendre des mois, voire des années. Le porte-parole de Google a déclaré à Recode que l’entreprise examinait régulièrement les commentaires sur ses résultats du Knowledge Graph, mais n’a pas commenté la fréquence à laquelle l’entreprise reçoit des demandes de modifications.
En fin de compte, le problème fait partie du problème plus large de Google : s’appuyer sur des algorithmes pour identifier et offrir les informations correctes ne fonctionne pas toujours et peut en fait risquer d’amplifier la désinformation.
Google affirme que son Knowledge Graph fonctionne en connectant des éléments d’information du Web concernant une personne, un lieu ou une chose en particulier, en particulier pour des personnes, des lieux et des choses notables. C’est plus avancé et spécifique que de faire apparaître des résultats basés uniquement sur des mots-clés, comme l’a expliqué l’entreprise lorsqu’elle a lancé l’outil en 2012. Google a utilisé les informations collectées à partir de ce système, qui, selon la société, comprend 500 milliards d’informations concernant 5 milliards d’entités, pour organiser les sections spéciales de ses résultats de recherche que la société appelle des panneaux de connaissances. Ces cases encouragent les internautes à rester sur la page de résultats de Google plutôt que de cliquer sur les résultats et de visiter d’autres sites Web.
Le Knowledge Graph de Google se concentre sur la mise en évidence de différentes informations sur le Web concernant un sujet ou une chose en particulier plutôt que de rechercher des informations qui incluent simplement les mêmes mots-clés.
Parfois, ces panneaux permettent d’obtenir des réponses plus rapidement et plus facilement sur Google. Mais Georgiev n’est qu’une des nombreuses personnes qui restent frustrées lorsque des informations sur les meurtriers apparaissent dans les fiches info lorsque les gens recherchent leur nom. D’autres fois, ces résultats rapporteront à tort qu’une personne est marié ou mort. Encore plus inquiétant, ces panneaux ont élevé un contenu haineux, comme ils l’ont fait il y a deux ans lorsqu’un panneau associé au terme « juif qui se déteste lui-même » – un terme antisémite – a joint une image du juif comédienne Sarah Silverman.
Eni Mustafaraj, professeur d’informatique à Wellesley, a déclaré à Recode que ces problèmes surviennent souvent lorsqu’un système informatique ne correspond pas à des informations provenant de deux sources différentes – dans le cas de Georgiev, une image et une page Wikipedia.
Dans le même temps, l’incident montre clairement à quel point les panneaux de connaissances de Google dépendent des informations éditées par les utilisateurs sur Wikipedia. « Ce genre d’histoire n’est qu’un rappel de la dépendance générale des moteurs de recherche vis-à-vis de ce qui est essentiellement du travail bénévole non rémunéré et non rémunéré d’un énorme groupe de personnes du monde entier », a déclaré Nicholas Vincent, doctorant à Northwestern qui a étudié les moteurs de recherche, dit Recode.
Google dit que les erreurs sont rares dans ces panneaux, mais il semble qu’il appartient toujours aux humains de détecter et de corriger leurs erreurs. « Vous travaillez avec des quantités massives d’informations, n’est-ce pas ? » Georgiev a déclaré à Recode. « Il y a forcément des erreurs. C’est juste que lorsque vous êtes Google, vous devez être très prudent avec ce genre de choses.
En attendant, dit-il, vous devriez commencer à rechercher vous-même sur Google.