Des scientifiques de l'Institut supérieur coréen des sciences et technologies (KAIST) ont dévoilé une puce d'IA qui, selon eux, peut égaler la vitesse de NvidiaLe GPU A100 de , mais avec une taille plus petite et une consommation d'énergie nettement inférieure. La puce a été développée en utilisant Samsung » data-auto-tag-linker= »true » data-before-rewrite-localise= »https://www.techradar.com/tag/samsung »>SamsungLe processus de fabrication de 28 nanomètres, une technologie considérée comme relativement ancienne dans le monde en évolution rapide des semi-conducteurs.
L'équipe, dirigée par le professeur Yoo Hoi-jun du centre de recherche sur le traitement en mémoire du KAIST, a développé ce qu'elle considère comme la première puce d'IA à « transformateur complémentaire » (C-Transformer) au monde. Ce système informatique neuromorphique imite la structure et le fonctionnement du cerveau humain, en utilisant un modèle d'apprentissage profond souvent utilisé dans le traitement des données visuelles.
« L'informatique neuromorphique est une technologie que même des sociétés comme IBM et Intel n'avons pas été en mesure de le mettre en œuvre, et nous sommes fiers d'être les premiers au monde à exécuter le LLM avec un accélérateur neuromorphique de faible puissance », a déclaré Yoo.
Des questions demeurent
Cette technologie apprend le contexte et la signification en suivant les relations au sein des données, telles que les mots dans une phrase, ce qui constitue une technologie clé pour les services d'IA générative tels que ChatGPT.
Lors d'une démonstration au siège du ministère des TIC, Kim Sang-yeob, membre de l'équipe, a présenté les capacités de la puce. Sur un ordinateur portable équipé de la puce, il effectuait des tâches telles que des sessions de questions-réponses, des résumés de phrases et des traductions à l'aide de OpenAILLM, GPT-2. Les tâches ont été accomplies au moins trois fois plus rapidement et, dans certains cas, jusqu'à neuf fois plus rapidement que lors de l'exécution de GPT-2 sur un ordinateur portable connecté à Internet.
La mise en œuvre de LLM dans des tâches d'IA générative nécessite généralement de nombreux GPU et 250 watts de puissance, mais l'équipe affirme que leur semi-conducteur n'utilise que 1/625 de la puissance du GPU de Nvidia pour les mêmes tâches. De plus, comme il mesure également 1/41 de la taille, mesurant seulement 4,5 mm sur 4,5 mm, il pourrait à terme être utilisé dans des appareils tels que les téléphones mobiles.
Reste toutefois à savoir si la puce pourra tenir ses promesses dans des applications réelles. Comme Le matériel de Tom rapporte : « Bien qu'on nous dise que la puce KAIST C-Transformer peut effectuer les mêmes tâches de traitement LLM que l'un des robustes GPU A100 de Nvidia, aucun des documents de presse ou de conférence que nous n'avons fourni de mesures de performances comparatives directes. Il s'agit d'une statistique significative, qui brille par son absence, et les cyniques supposeraient probablement qu'une comparaison des performances ne rend pas service au C-Transformer.