En bref: Meta a conçu et construit ce qu’il pense être le supercalculateur d’IA le plus rapide au monde. L’AI Research SuperCluster (RSC) fait déjà partie des supercalculateurs d’IA les plus rapides et devrait être sans égal lorsqu’il sera complètement achevé à la mi-2022.
Dans l’état actuel des choses, le système est composé de 760 systèmes Nvidia DGX A100 (6 080 GPU) liés à l’aide d’une structure Clos à deux niveaux Nvidia Quantum 1600 Gb/s InfiniBand sans surabonnement.
De plus, le système dispose de « 175 pétaoctets de Pure Storage FlashArray, 46 pétaoctets de stockage en cache dans les systèmes Penguin Computing Altus et 10 pétaoctets de Pure Storage FlashBlade ». Les premiers tests montrent que le système est jusqu’à 20 fois plus rapide dans les flux de travail de vision par ordinateur, neuf fois plus rapide dans la bibliothèque de communication collective Nvidia (NCCL) et peut former des modèles NLP à grande échelle trois fois plus rapidement que l’infrastructure de production et de recherche héritée de Meta.
Ce n’est que le début. Une fois terminé, Le supercalculateur de Meta connectera 16 000 GPU. Ils ont également conçu un système de mise en cache et de stockage qui peut servir 16 To/s de données de formation, avec des plans pour le faire évoluer jusqu’à un exaoctet.
Méta mentionné le travail effectué avec RSC l’aidera à développer des technologies pour la prochaine grande plate-forme informatique, le métaverse. C’est ici que Meta pense que les applications et les produits basés sur l’IA deviendront encore plus importants.
En effet, si la vision de Meta du métaverse se déroule comme l’espère l’entreprise, cela nécessitera sans aucun doute une puissance de traitement colossale. Un supercalculateur de cette envergure pourrait grandement contribuer à concrétiser le concept.