Il est difficile de convaincre les utilisateurs de changer de moteur de recherche. C’est l’une des raisons pour lesquelles les startups de services de recherche publique réussissent rarement. Une autre est qu’il est coûteux d’indexer un grand nombre de sites Web (Google a un estimatif des dizaines de milliards de pages indexées), mais une société soutenue par Y Combinator, Andi, n’est pas découragé – aller de l’avant pour construire un assistant d’IA qui fournit des réponses au lieu de liens lors de la recherche en ligne.
Andi a été fondée par Angela Hoover, qui s’est inscrite au YC’s École de démarrage après avoir abandonné l’université et être entré dans le lot d’hiver 2022 de YC. Après avoir travaillé à l’étranger dans la construction et avec Microsoft en tant qu’administrateur de projet de centre de données, Hoover a rencontré le cofondateur d’Andi, Jed White, à l’aéroport de Denver à son retour aux États-Unis.
Hoover et White – qui avaient une expérience de l’IA et de la recherche, en particulier du classement de la qualité du contenu, des requêtes et de la classification – ont parlé de la façon dont la recherche sur le Web était devenue mauvaise pour des choses comme les voyages et de ce qu’il faudrait pour construire un nouveau type de moteur de recherche à partir de zéro.
« La génération Z déteste Google. Pour nous, la recherche est brisée. Nous vivons sur nos téléphones dans des applications de messagerie avec des flux visuels comme TikTok et Instagram », a déclaré Hoover à TechCrunch dans une interview par e-mail. Elle ne conjecture pas — Google execs ont admis autant. « J’entends mes amis dire constamment que Google est nul. Les résultats de recherche sont submergés d’annonces, de spam SEO et d’encombrement. La génération Z est tellement désespérée pour une alternative que nous utilisons TikTok comme moteur de recherche. Nous détestons les publicités effrayantes envahissantes, et comment Google est Big Brother et surveille tout.
Hoover propose l’assistant alimenté par l’IA d’Andi comme alternative. Le système à usage général tente de trouver et d’extraire des réponses aux questions, en combinant de grands modèles de langage similaires au GPT-3 d’OpenAI avec des données Web en direct.
Dans les coulisses, Andi extrait des informations des résultats Web classés pour la pertinence de la question posée ainsi que pour la qualité globale (bien qu’il ne soit pas clair comment Andi définit la « qualité »). Selon le sujet, la plate-forme utilise différents systèmes d’IA adaptés à des secteurs verticaux spécifiques (par exemple, les connaissances factuelles, la programmation ou la santé des consommateurs) et des modèles de langage qui génèrent des réponses en combinant les connaissances à travers plusieurs sources (par exemple, Wolfram Alpha, Forbes, The New York Times, etc.).
C’est un pas au-delà de celui de Google extraits en vedette, qui extraient du texte des pages Web pour répondre aux questions fréquemment posées, et plus proches des moteurs dits de « recherche cognitive » tels que Amazon Kendra et Microsoft SharePoint Syntex qui s’appuient sur des bases de connaissances pour bricoler des réponses. Startups comme Hebbia, Kagi et You.com tirez également parti de l’IA pour renvoyer du contenu spécifique à partir du Web en réponse à des requêtes, par opposition à de simples listes de résultats.
Alors, qu’est-ce qui distingue Andi? Contrairement à certains de ses concurrents, Hoover affirme qu’il ne facture pas son service ni n’enregistre d’informations personnellement identifiables. Andi n’enregistre pas non plus et ne stocke pas les recherches ou les résultats que les gens lisent ou sur lesquels ils cliquent, utilisant uniquement des données de localisation grossières pour améliorer la pertinence des résultats de recherche.
« Même lorsque nous ajouterons l’option pour les comptes d’utilisateurs à l’avenir, nous ne collecterons et ne conserverons que suffisamment de données pour aider nos clients à utiliser efficacement le service, lorsqu’ils souhaitent créer un compte ou être mémorisés entre les appareils et les sessions, et pour améliorer le service que nous fournissons », a déclaré Hoover. « Les utilisateurs nous disent qu’Andi peut leur faire économiser 15 ou 20 minutes de recherche, et nous ont demandé de les laisser l’utiliser avec leur propre équipe et leurs données personnelles … Au fur et à mesure que nous améliorons la technologie de réponse aux questions et ajoutons un support pour se connecter à des sources de données privées, nous pensons que cela a un potentiel énorme.
Pour filtrer les informations qui pourraient être trompeuses – ou manifestement fausses – Hoover dit qu’Andi utilise des techniques telles que des listes de blocage et des mesures de classement. La désinformation est un problème en évolution, bien sûr – un Google lui-même a Lutté avec. Mais Hoover a exprimé sa confiance dans les mesures techniques qu’Andi a prises pour atténuer l’impact.
« Toutes les autres nouvelles start-up de recherche font encore une autre copie plus faible de Google avec la même page encombrée de liens bleus ciblés sur un navigateur Web, avec plus ou moins de variation sur les publicités et les pratiques de confidentialité », a-t-elle déclaré. « Le contenu que vous voyez dans [Andi’s] les résultats sont extraits de la source en direct dans la mesure du possible, plutôt que d’un index périmé. La question answering s’améliore rapidement et, dans de nombreux domaines, il est déjà excellent.
Dans une expérience rapide, j’ai introduit quelques requêtes controversées dans Andi et j’ai constaté que le moteur de recherche les gérait assez habilement, pointant systématiquement vers des sources factuelles. Une recherche pour « Qui a vraiment gagné l’élection de 2020? » a donné la réponse « Joe Biden », tandis que la requête « Les vaccins COVID-19 sont-ils faux? » a tiré un article de Forbes démystifiant les théories du complot pandémique.
Andi est toujours très en alpha et a l’intention de rester maigre pendant qu’il itére en fonction des commentaires des premiers utilisateurs, dit Hoover. La startup aura des décisions difficiles à prendre. En tant que New-Yorkais Notes, les algorithmes de recherche sont sensibles à divers biais, par exemple en ne donnant la priorité qu’aux sites Web qui utilisent des technologies Web modernes. Ils ouvrent également la porte à de mauvais acteurs. En 2020, Pinterest Profité d’une bizarrerie de l’algorithme de recherche d’images de Google pour faire apparaître plus de son contenu dans les recherches Google Image.
Alors qu’elle est aux prises avec ces problèmes, l’équipe d’Andi continue de découvrir son modèle d’affaires. Alors que le service de base restera gratuit, Hoover dit qu’Andi proposera éventuellement des plans professionnels et commerciaux payants avec des fonctionnalités premium et un accès API, permettant aux clients d’utiliser les capacités de recherche et de réponse aux questions d’Andi avec du contenu payant, des données personnelles et des données internes d’entreprise et d’équipe.
Les fonctionnalités payantes sont probablement la bonne voie à suivre, étant donné que la part de Google sur le marché mondial de la recherche est restée stable à plus de 90% pendant la majeure partie de la dernière décennie. Bing suit avec 3,4%, suivi de Yahoo! (divulgation complète: la société mère de TechCrunch) à 1,34%, selon à Statcounter.
Pour financer le développement de ces fonctionnalités et des partenariats potentiels avec des moteurs de recherche alternatifs, Andi a récemment levé 2,5 millions de dollars, qui comprennent le soutien de YC, Gaingels, GoodWater Capital, K20 Fund, Acacia Venture Capital Partners, Fepo Capital et BBQ Capital, ainsi qu’une petite famille et des amis.
« Nous avons maintenu notre taux de combustion bas, travaillant comme nomades numériques hors du Mexique pour étendre notre piste et restant économes. Même après avoir ajouté des développeurs d’IA et augmenté nos coûts de formation de modèles, nous avons bien plus de deux ans de piste », a déclaré Hoover. « Nous utilisons les fonds pour améliorer notre IA générative propriétaire pour répondre à des questions complexes, et la technologie de « recherche de recherches verticales et d’API » qu’Andi utilise pour combiner de grands modèles de langage avec des données en direct, en particulier : le développement et la formation de modèles d’IA, l’ajout de développeurs d’IA supplémentaires à notre équipe et les coûts d’hébergement et d’inférence à mesure que nous commençons à augmenter l’utilisation une fois que nous nous rapprochons de l’adéquation du marché des produits … À ce stade précoce, nous nous concentrons sur la création d’une recherche vraiment géniale que nos utilisateurs adorent, avant de générer des revenus.
Andi ne collecte pas de mesures détaillées, mais Hoover estime que le moteur de recherche compte environ 5 000 utilisateurs à l’heure actuelle. Andi prévoit d’ajouter un développeur d’IA à temps plein avant la fin de l’année, ce qui porterait son effectif total à trois, dont Hoover et White.