Dans le contexte: L’afflux récent d’annonces présente une tendance mondiale de nouvelles offres visant à introduire des capacités d’IA génératives pour les entreprises. Des géants de la technologie comme IBM, Google, Salesforce, Microsoft, Amazon à Meta, il semble que chaque entreprise technologique profite de l’enthousiasme suscité par cette nouvelle technologie transformatrice.
Il est devenu de plus en plus clair que la plupart des organisations sont impatientes d’adopter l’IA. Les entreprises identifient rapidement les améliorations potentielles de la productivité, les gains d’efficacité et les autres avantages que l’IA peut apporter. Cependant, un problème important se pose lorsque ces entreprises ne savent pas exactement comment elles peuvent commencer à tirer parti de l’IA générative. Les experts ayant une connaissance approfondie du fonctionnement de la technologie et de la manière dont elle peut être mise en œuvre sont rares et, sans parler, très coûteux.
Reconnaissant cette déconnexion, Dell Technologies et Nvidia ont mis en place une offre appelée Project Helix, spécialement conçu pour simplifier le processus de démarrage avec l’IA générative. Project Helix se concentre sur la création de solutions d’IA générative complètes sur site qui permettent aux entreprises de créer de nouveaux modèles de base d’IA générative ou de les personnaliser existants à l’aide de leurs propres données.
Un problème qui est apparu dans les entreprises qui commencent à utiliser des services d’IA générative est le risque de fuite IP interne. En fait, plusieurs entreprises, dont Samsung et Apple, ont mis en place des politiques empêchant leurs employés d’utiliser des outils comme ChatGPT à des fins professionnelles en raison de préoccupations liées à ce problème.
Une partie de la raison de cette préoccupation est que pratiquement toutes les premières itérations de l’IA générative ne pouvaient fonctionner que dans d’énormes centres de données basés sur le cloud, dont beaucoup collectaient les données saisies dans leurs entrées rapides. Cependant, dans l’évolution incroyablement rapide des modèles de base qui sous-tendent les applications d’IA génératives, un certain nombre de ces préoccupations ont été résolues. Notamment, il existe désormais une large gamme de modèles open source disponibles sur des marchés comme Hugging Face. Bon nombre de ces modèles open source peuvent fonctionner très efficacement avec des exigences informatiques plus raisonnables, telles que celles d’un centre de données sur site correctement équipé. De plus, certaines des grandes entreprises technologiques ont commencé à modifier les règles sur l’endroit où leurs modèles peuvent être exécutés et créent des versions plus petites de leurs modèles optimisées pour une utilisation sur site.
De plus, nous avons vu plusieurs entreprises, dont Nvidia, commencer à proposer des modèles spécifiquement conçus pour les applications d’entreprise. Le développement de Nvidia est intéressant à plusieurs niveaux. L’entreprise est fortement associée à l’IA générative principalement en raison de son matériel. Les puces GPU de Nvidia alimentent une grande majorité des applications et services d’IA générative actuels dans le cloud. Lors de la dernière conférence GTC de la société en mars, ils en ont surpris plus d’un en dévoilant toute une gamme de logiciels génératifs liés à l’IA, y compris des modèles de base logicielle spécifiques à l’industrie et des outils de développement axés sur l’entreprise, notamment ses frameworks NeMo Large Language Model (LLM) et NeMo. Garde-corps pour filtrer les sujets indésirables. Il n’est pas surprenant que ces modèles aient été optimisés pour fonctionner sur du matériel Nvidia.
Project Helix représente un effort de collaboration entre Dell et Nvidia pour assembler une gamme de systèmes de serveurs Dell PowerEdge. Ceux-ci incluent les GPU Nvidia H100 et la gamme de DPU Bluefield de Nvidia (unités de traitement de données, utilisées pour les interconnexions à haut débit entre les serveurs nécessaires aux charges de travail AI) et sont fournis avec le logiciel Enterprise AI de Nvidia.
De plus, Dell propose plusieurs options de stockage différentes à partir de ses gammes PowerScale et ECS Enterprise Object Storage, optimisées pour les charges de travail d’IA. Le résultat est une solution complète qui permet aux entreprises de commencer à créer ou à personnaliser des modèles d’IA génératifs. Les clients potentiels peuvent soit utiliser l’une des options de modèle de base de Nvidia, soit, s’ils préfèrent, sélectionner un modèle open source de Hugging Face (ou une solution d’un autre fournisseur de technologie) et démarrer le processus.
Le logiciel Nvidia fourni permet d’importer le corpus de données existant d’une organisation – allant des documents, des discussions du service client, des publications sur les réseaux sociaux, et bien plus encore – puis de l’utiliser pour former un nouveau modèle ou personnaliser un modèle existant. Une fois le processus de formation terminé, les outils nécessaires pour exécuter des inférences et créer de nouvelles applications tirant parti du modèle nouvellement formé sont également inclus. L’offre groupée de Dell fournit également un modèle pour aider les entreprises à naviguer dans le processus de création/personnalisation de ces modèles et de construction de ces outils, ainsi qu’une gamme de services de support technique.
Plus important encore, parce que ce travail est effectué en interne, Project Helix peut aider à atténuer les problèmes de fuite IP qui concernent de nombreuses entreprises, même celles qui ont commencé à travailler avec des outils d’IA générative.
Un autre avantage important de Project Helix est qu’il permet aux entreprises de tirer parti de l’IA générative d’une manière plus unique et personnalisée. Alors que les outils à usage général actuellement disponibles peuvent sans aucun doute aider avec certains types d’applications et d’environnements, la plupart des entreprises reconnaissent que le véritable avantage concurrentiel de l’IA générative réside dans la personnalisation. Il y a un intérêt considérable à incorporer les propres données d’une entreprise dans ces outils, mais il y a aussi beaucoup de confusion quant à la façon exacte de le faire.
Mettre en place un « kit facile » pour l’IA générative ne signifie pas que de nombreuses organisations n’auront pas de difficultés à tirer parti de leurs données et de leur technologie pour créer les solutions dont elles ont besoin. Il est crucial de se rappeler que les concepts derrière l’IA générative sont encore très nouveaux et qu’il s’agit d’une technologie extrêmement complexe. Néanmoins, en regroupant le matériel et les logiciels nécessaires qui ont été prétestés pour fonctionner ensemble, ainsi que des informations sur la façon de naviguer dans le processus, Project Helix semble être une option attrayante pour les organisations désireuses – ou se sentant compétitives obligées – de plonger dans ce passionnant nouveau royaume.
Bob O’Donnell est le fondateur et analyste en chef de TECHnalysis Research, LLC une société de conseil en technologie qui fournit des services de conseil stratégique et d’étude de marché à l’industrie technologique et à la communauté financière professionnelle. Vous pouvez le suivre sur Twitter @bobodtech