Quand Pomme de pin a lancé une base de données vectorielles destinée aux data scientists en 2021, elle était probablement en avance sur son temps. Mais alors que les cas d’utilisation commençaient à prendre forme l’année dernière, l’entreprise a commencé à pousser la recherche sémantique basée sur l’IA. Avec la montée des LLM dans la conscience publique, les entreprises commencent à voir encore plus la valeur des bases de données vectorielles.
Les investisseurs sont apparemment d’accord. Aujourd’hui, la société a annoncé un investissement de 100 millions de dollars en série B sur une évaluation post-évaluation de 750 millions de dollars. Ces types de chiffres ont été difficiles à obtenir dans un environnement d’investissement conservateur, mais la société se développe rapidement et les investisseurs ont vu une opportunité de saisir un leader du marché, déclare le PDG et fondateur de Pinecone, Edo Liberty.
« Nous sommes clairement les créateurs de cette catégorie et les leaders de celle-ci. Lorsque nous avons créé cette catégorie, avec la catégorie des bases de données vectorielles, personne ne savait de quoi nous parlions. Maintenant, bien sûr, c’est un marché bien formé et la catégorie a différents acteurs, et donc des opérateurs historiques et des nuages et ainsi de suite, et nous sommes clairement en avance. Et donc c’est très facile de parier sur le leader d’une catégorie qui est déjà formée », a déclaré Liberty à fr.techtribune.net.
Cet avantage de premier sur le marché les aide à passer d’une poignée de clients l’année dernière à 1 500 aujourd’hui, et Liberty affirme que le taux de croissance ressemble plus à un outil de consommation qu’à une base de données hautement technique. L’entreprise suscite l’intérêt d’entreprises de toutes tailles, y compris des entreprises technologiques comme Shopify, Gong et Zapier.
« C’est comme l’adoption par les consommateurs de trucs de technologie profonde B2B. Je n’ai jamais rien vu de tel. Et donc vous devez accélérer le renforcement de ces capacités, et c’est très coûteux et très difficile », a-t-il déclaré.
Il dit que l’intérêt pour les LLM suscite l’intérêt pour la base de données vectorielles, mais c’est une proposition différente. Alors que les deux prennent de grandes quantités de données et vous permettent de les rechercher, avec un LLM, les données sont intégrées au modèle, et donc moins flexibles, tandis que la base de données vectorielle est conçue pour la recherche sémantique, mais a la flexibilité d’une base de données.
« Tout ce système de gestion des connaissances finit par être beaucoup plus flexible, beaucoup plus efficace, beaucoup plus facile à utiliser [with a vector database], » il dit. Il cite l’exemple de la conformité au RGPD. Si vous devez supprimer un enregistrement, c’est assez simple à faire dans une base de données, mais il est beaucoup plus difficile de supprimer les mauvaises données d’un modèle en raison de la façon dont il est structuré.
Peter Levine, qui dirige l’investissement d’aujourd’hui pour Andreessen Horowitz et rejoindra le conseil d’administration de Pinecone, considère la base de données vectorielle comme un élément clé de la pile d’IA. « Nous pensons que cette base de données vectorielles, et en particulier Pinecone, a la possibilité d’être vraiment un composant fondamental de la nouvelle pile de données d’IA. Et donc nous sommes vraiment convaincus que mettre les ressources derrière l’entreprise va l’aider à réaliser la vision finale d’Edo », a déclaré Levine à fr.techtribune.net.
De plus, Levine voit la base de données vectorielles travailler avec les LLM pour agir comme une source de vérité, qui pourrait vraisemblablement réduire le problème d’hallucination que nous avons vu avec les LLM. « Eh bien, ils travaillent ensemble. Je veux dire, considérez le LLM comme une application qui se trouve presque au-dessus de cette base de données, et ce que la base de données fera, c’est qu’elle contiendra des informations et les alimentera dans LLM pour des réponses plus précises pour le stockage à long terme des résultats », a-t-il déclaré. . Liberty considère cela comme la base de données agissant comme la mémoire à long terme du LLM.
Avec une piste de 100 millions de dollars, l’entreprise embauchera. Il compte environ 100 employés aujourd’hui, et Liberty s’attend à en atteindre peut-être 150 ou 200 d’ici la fin de l’année.
L’espace de la base de données vectorielle s’est réchauffé depuis le lancement de Pinecone il y a quelques années avec les joueurs Qdrant, Zilliz et Chromatous levant des fonds récemment.
L’investissement d’aujourd’hui a été dirigé par Andreessen Horowitz avec la participation d’ICONIQ Growth et des investisseurs précédents Menlo Ventures et Wing Venture Capital. La société a maintenant levé 138 millions de dollars, dont une série A de 28 millions de dollars l’année dernière et un investissement de démarrage de 10 millions de dollars en 2021.