Qwant, le moteur de recherche français axé sur la protection de la vie privée, et Ecosia, un moteur de recherche à but non lucratif basé à Berlin qui utilise les revenus publicitaires pour financer la plantation d’arbres et d’autres initiatives axées sur le climat, unissent leurs forces dans le cadre d’une coentreprise pour développer leur propre indice de recherche européen.

Le duo espère que cette décision contribuera à stimuler l’innovation dans leurs moteurs de recherche respectifs – y compris et surtout autour de l’IA générative – ainsi qu’à réduire la dépendance aux index de recherche fournis par les géants de la technologie Microsoft (Bing) et google. Les deux s’appuient actuellement sur les API de recherche de Bing, tandis qu’Ecosia utilise également les résultats de recherche de Google.

L’augmentation des coûts des API est l’une des motivations évidentes de la volonté de réduire cette dépendance des Big Tech, avec Microsoft a massivement augmenté les prix des API de recherche de Bing l’année dernière.

Ni Ecosia ni Qwant n’arrêteront complètement d’utiliser Bing ou Google. Cependant, ils visent à diversifier la technologie de base en soutenant leurs services avec leur propre indice. Cela réduira leurs coûts d’exploitation et servira de base technique pour alimenter le développement de leurs propres produits, car les technologies GenAI jouent un rôle plus central dans de nombreux services numériques destinés aux consommateurs.

Les deux moteurs de recherche ont déjà essayé d’intégrer les fonctionnalités de GenAI. Attendez-vous à plus sur ce front, bien qu’ils ne prévoient pas de développer eux-mêmes le développement de modèles d’IA. Ils disent qu’ils continueront à s’appuyer sur l’accès API aux grands modèles de langage (LLM) des principales plateformes pour alimenter ces ajouts.

Publicité

Le duo est également ouvert à d’autres entreprises européennes qui se joindront à leur volonté de renforcer la souveraineté de la pile technologique, au moins en tant que clients de l’indice de recherche, car elles prévoient d’accorder une licence d’accès via une API. D’autres formes de partenariat pourraient également être envisagées, ont-ils déclaré à TechCrunch.

« La porte est ouverte et nous sommes prêts à discuter avec tout le monde », a déclaré Olivier Abecassis, PDG de Qwant. « Mais nous voulons aussi nous concentrer et vraiment sécuriser la capacité d’investir avec nos actionnaires existants. »

« Nous savons que nous allons alimenter l’entreprise pour les prochaines années, et nous savons que nos actionnaires sont prêts à la soutenir, et nous nous attendons vraiment à ce que nous agissions rapidement », a-t-il ajouté. « Nous discuterons avec les investisseurs pour accélérer les développements et en faire plus, et avec d’autres pour nous joindre au partenariat. Le plan est donc vraiment d’aller le plus vite possible.

L’IA génère des risques et des opportunités

L’IA suscite un double sentiment d’urgence pour les deux parties, car elle crée rapidement un paysage de nouvelles opportunités et de pièges potentiels.

« Avec l’émergence des outils d’IA, la demande pour un index de recherche est différente », a suggéré Christian Kroll, PDG d’Ecosia. « Les deux fournisseurs, Bing et Google, sont de plus en plus réticents à rendre leur index accessible. Et bien sûr, en tant que moteur de recherche, nous avons besoin d’un index. C’est en partie pourquoi nous voulons nous assurer d’y avoir accès.

« Mais il y a aussi un moment unique où vous pouvez utiliser ce type d’indice pour créer une expérience très différente – en utilisant l’IA générative pour créer une expérience différente – et nous ne voulons pas être limités dans l’utilisation de cette technologie. »

Kroll a également souligné un environnement réglementaire en Europe désireux de favoriser l’innovation technologique locale afin de renforcer l’autonomie stratégique du bloc comme une autre raison de miser sur un index de recherche homebrew maintenant.

« L’opportunité s’est beaucoup améliorée », a-t-il déclaré. « Avec le [EU’s] Pour la première fois, dans le cadre de la loi sur les marchés numériques, les données relatives aux clics et aux requêtes, par exemple, seront partagées par d’autres moteurs de recherche, ce qui nous permet d’y avoir accès. De plus, l’accès aux plateformes est différent de ce qu’il était. Nous y réfléchissons donc depuis longtemps, mais maintenant c’est le bon moment pour le faire.

« Nous pensons que si nous voulons obtenir une expérience utilisateur GenAI significative, nous devons avoir accès aux modèles LLM », a ajouté Abecassis. « Mais nous avons également besoin d’avoir accès à la technologie de recherche. »

La combinaison de modèles GenAI avec des informations à jour extraites par le biais de requêtes de recherche sera essentielle pour faire progresser l’utilité des produits de recherche, a-t-il affirmé.

« Nous pensons que la combinaison des deux sera la prochaine expérience utilisateur pour la recherche », a-t-il déclaré. « Search et GenAI ne sont pas exactement les mêmes. Nous pensons que les deux bénéficieront de l’autre, et que le mélange sera unique.

« Google a décidé d’avoir deux produits solides, mais de ne pas les mélanger. Et je peux comprendre quand je regarde le modèle économique hérité de Google. Mais à l’avenir, il se passera quelque chose entre [these technologies] Et c’est ce que nous voulons vivre. Et pour cela, tout acteur du marché devra avoir accès à une technologie de recherche. C’est pourquoi nous voulons vous proposer [this] au marché.

Vers une perspective européenne

La nouvelle coentreprise du duo, qui s’appelle European Search Perspective, est en cours de création avec une répartition 50/50 de la propriété. (Remarque : EUP est l’acronyme qu’ils ont choisi, plutôt que ESP.)

Ecosia et Qwant n’ont pas divulgué le montant de leurs investissements, mais ont déclaré que leurs actionnaires les soutenaient. De plus, en tant qu’entité distincte, EUP se situera en dehors du modèle d’affaires à but non lucratif de la première, ce qui lui permettra de lever des capitaux externes (en supposant que les investisseurs puissent être persuadés de monter à bord).

L’indice devrait commencer à servir le trafic des moteurs de recherche basés en France pour Ecosia et Qwant d’ici le premier trimestre de l’année prochaine. D’ici la fin de 2025, il s’étendra ensuite à une « partie importante » du trafic en Allemagne.

L’anglais serait la troisième langue qu’ils chercheraient à ajouter, ont déclaré les deux hommes, ajoutant que d’autres langues européennes pourraient suivre à l’avenir si l’élan se développe.

Sur le plan opérationnel, l’équipe d’ingénieurs de Qwant passera à EUP, tandis qu’Abecassis – qui a assumé le rôle de PDG du moteur de recherche il y a un peu plus d’un an – sera également PDG de la coentreprise.

Qwant a été racheté par un groupe de technologie cloud appelé Synfonium l’année dernière, qui est soutenue par les fondateurs de la société française de cloud computing OVHcloud, dans le but de construire un « champion européen » des services cloud.

Discutant du plan pour EUP lors d’un appel avec TechCrunch, Abecassis a expliqué que Qwant travaillait sur le développement de son propre index de recherche avant même d’être acquis par Synfondium. Ces efforts vont maintenant être transférés à l’EUP, a-t-il confirmé, l’équipe et les actifs de propriété intellectuelle étant transférés.

Unir ses forces avec Ecosia renforce les chances de succès, a-t-il suggéré, car cela élargit le pool de données disponibles pour le développement de l’indice, ainsi que l’augmentation des investissements dans le projet et permet un développement plus rapide, par exemple en étant en mesure d’embaucher plus d’ingénieurs.

Ecosia compte environ 20 millions d’utilisateurs mensuels dans le monde, tandis que Qwant compte environ 6 millions d’utilisateurs en France.

« Si nous voulons être vraiment efficaces, nous devons impliquer plus de personnes… et être plus ambitieux », a déclaré Abecassis, racontant comment Qwant a approché Ecosia pour lui demander d’envisager un partenariat pour développer l’indice de recherche.

« Pour Qwant, c’est une opportunité majeure de construire de meilleures technologies – parce que les technologies de recherche sont bonnes si elles sont utilisées… Ainsi, plus la technologie est utilisée, plus vous pouvez investir d’argent, mais aussi plus vous obtenez de données. L’une des raisons pour lesquelles Google est si fort est qu’il est basé sur des tonnes de données.

Les deux entreprises partagent quelques caractéristiques qui font qu’un partenariat semble être une bonne adéquation culturelle, les deux alternatives de recherche étant développées en Europe et ayant des modèles commerciaux qui cherchent à faire quelque chose de différent par rapport au manuel standard du capitalisme de surveillance des Big Tech. EUP, quant à elle, aura son siège à Paris.

« Construire une telle technologie à partir de zéro est presque impossible », a ajouté Abecassis. « Plus il y a d’utilisateurs[s] Nous en avons et plus nous aurons d’ensembles de données, plus la technologie sera précieuse.

M. Kroll a déclaré qu’Ecosia apportait son expertise, ses données et son financement au partenariat, notant qu’en plus de développer le moteur de recherche, il y aura d’autres technologies que l’EUP devra développer, telles que des widgets qui peuvent être servis dans le cadre des résultats de recherche.

Le duo s’attend à ce que le partenariat augmente l’efficacité des résultats de recherche qu’ils peuvent fournir à leurs utilisateurs respectifs, à mesure que l’EUP affine ses algorithmes de classement, même si chaque moteur de recherche continuera à développer sa propre expérience utilisateur distinctive.

Alternatives de classement dans les moteurs de recherche

Le moteur de recherche rival Brave, qui, tout comme Qwant, a un argumentaire de vente qui met l’accent sur la confidentialité, a déjà construit son propre index de recherche. Il a même supprimé les derniers appels d’API pour les recherches textuelles vers Bing dans Avril de l’année dernière lorsqu’il a présenté son service comme une « véritable alternative à la recherche Big Tech ».

Interrogé à ce sujet, Abecassis a suggéré que l’indice de Brave se rapproche de Google et de Bing dans l’approche technique. Attendu qu’il a souligné que l’EUP est construit à partir de zéro, affirmant qu’il sera « très différent » et fournira des résultats de recherche plus diversifiés.

« Nous ne nous contentons pas de copier Google ou Microsoft et d’apprendre d’eux », a-t-il souligné. « Nous indexons vraiment tous les documents qui sont disponibles. Nous comprenons les documents, puis nous avons une équipe qui travaille à trouver la meilleure correspondance entre un document et le [search] requête.

« Il est donc vrai qu’il y a probablement des raccourcis pour construire une telle technologie en copiant les hommes principaux. Nous avons décidé d’aller dans une direction différente et de tout construire à partir de zéro. C’est plus difficile, mais nous pensons que c’est plus durable.

Une grande différence par rapport à la recherche Big Tech est que l’index de recherche d’EUP proposera des résultats « privilégiant la confidentialité ». Qu’est-ce que cela signifie en pratique ? Abecassis a déclaré que c’est le résultat d’une technologie développée par Qwant qui ne personnalise pas les résultats de recherche en fonction de l’utilisateur (comme le fait Google).

« Nous allons continuer à travailler sans aucun [user] données [personalizing results] », a-t-il déclaré. « Ensuite, nous améliorerons notre algorithme en fonction des données disponibles. »

« Je pense que c’est une grande victoire – une grande victoire pour la vie privée », a ajouté Kroll à propos du choix de l’approche technique. Mais il a également souligné la valeur stratégique d’avoir une infrastructure de recherche fabriquée en Europe à une époque d’instabilité géopolitique croissante.

« D’un point de vue européen… Qu’est-ce que [search infrastructure reliance] pour la dépendance vis-à-vis de l’Union européenne ? Surtout si l’on considère [the U.S] les résultats des élections… Si le gouvernement américain décidait qu’il ne voulait plus fournir de résultats de recherche aux Européens, nous, en Europe, devrions revenir aux annuaires téléphoniques.

« Il y a un élément de confidentialité, mais il y a aussi un élément de souveraineté des données, ce qui me semble très important », a-t-il ajouté. « J’espère bien sûr que les États-Unis et l’Europe resteront toujours des alliés forts. Mais je ne sais pas où vont les États-Unis, et je ne sais pas non plus où l’Europe se dirige. C’est donc un élément très important.

Une entreprise coûteuse ?

fr.techtribune.neta interrogé Brave sur sa propre décision de créer un index de recherche. Il nous a dit qu’avant de passer à sa propre technologie, il « risquait toujours que Microsoft nous impose des restrictions ou nous coupe simplement » – donc cette décision était destinée à libérer l’entreprise d’une dépendance risquée.

« Selon notre équipe d’évaluation de la qualité, qui effectue des évaluations à l’aveugle pour la qualité des résultats, nous sommes à égalité avec Google et meilleurs que Bing dans les pays que nous mesurons (ceux dans lesquels Brave Search est la valeur par défaut pour les utilisateurs du navigateur Brave) », nous a également déclaré la société, ajoutant que Brave Search est « le moteur de recherche à la croissance la plus rapide depuis Bing » avec plus d’un milliard de requêtes par mois.

Discutant des coûts de développement de l’indice, Brave a décrit le processus comme « long et très coûteux », rappelant son acquisition en 2021 du moteur de recherche open source Tailcat, une technologie dont le développement remonte à 2014.

« Il y a une raison pour laquelle il n’y a que trois index de recherche indépendants à part entière en Occident », a ajouté Brave.

L’entreprise octroie une licence pour son index de recherche via le API de recherche Brave. L’API est utilisée par « de nombreuses entreprises de premier plan dans le domaine de l’IA », selon Brave, qui a ajouté qu’elle devenait rapidement une source de revenus « importante ».

fr.techtribune.neta également demandé à l’ingénieur de recherche Peter Popov sur les coûts liés à la création d’un index de recherche. Popov a passé 15 ans chez le géant russe de la recherche Yandex, où il a travaillé sur la recherche de base et le classement, et est maintenant vice-président des publicités chez VK.

« En gros, un index de recherche, qui comprend le matériel et le coût de rédaction d’une recherche, ne coûte pas beaucoup plus de 10 millions de dollars », nous a dit Popov, qualifiant une telle dépense de « pas un investissement très important ». Il a suggéré que les progrès de l’IA ont facilité la production de résultats de recherche de qualité sans avoir besoin d’un grand nombre d’utilisateurs fournissant des données, « en utilisant des modèles LLM modernes qui contiennent des connaissances de la sémantique de recherche prêtes à l’emploi ».

Dans le même temps, il a averti qu’il y avait un défi croissant quant à l’endroit où les robots de recherche peuvent – ou ne peuvent pas – explorer librement. Il s’agit d’un problème, car un index de recherche a besoin d’un large accès aux sources d’information afin de répondre utilement aux requêtes des utilisateurs.

« Les plates-formes propriétaires sont souvent assez hostiles aux tentatives de collecte d’informations », a déclaré Popov à TechCrunch.

« La création d’un index de recherche pour l’ensemble d’Internet n’est pas une tâche si difficile d’un point de vue technique. Le volume d’informations utiles sur Internet croît plus lentement que la puissance de calcul. D’ailleurs, l’un des problèmes de la mise à l’échelle de l’IA est précisément le volume relativement faible de ces informations.

« L’Internet n’est pas si grand », a-t-il poursuivi. « Il n’y a pas d’Internet de sites à rechercher pour le moment. Et attendez, de ceux-ci [mainstream web] plates-formes, seule Wikipédia est ouverte à la recherche. Reste donc la recherche sur Wikipédia.

« Après Wikipédia, il n’y a pas beaucoup de sites utiles comme arxiv.org ou les grandes bibliothèques en ligne. Les informations de ce type peuvent être utilisées de deux manières : soit en fournissant des données pendant l’entraînement du réseau, soit en alimentant le réseau neuronal avec des résultats de recherche pendant l’inférence, auquel cas la recherche est l’un des composants de LLM travaillant sous le capot.

En d’autres termes, pour qu’un index de recherche soit utile, il doit également être capable d’explorer librement Internet. Mais avec Big TeDe nos jours, alors que les géants se disputent à nouveau la monétisation des données des utilisateurs pour former des LLM, cela complique également l’activité d’essayer de sortir de leur ombre en indexant Internet pour la recherche… De l’encreau à l’enclume, donc.

5/5 - (115 votes)
Publicité
Article précédentAlors que la demande de lithium explose, la start-up de recyclage de batteries Tozero sprinte pour se développer avec 11,7 millions de dollars de démarrage
Article suivantLa collection Final Fantasy Pixel Remaster bénéficie d’une remise importante sur Amazon

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici