La grande image: Nous consommons tellement de vidéos sur YouTube, mais nous nous arrêtons rarement pour penser à la magie qui se produit dans les coulisses qui nous permet de regarder facilement des vidéos et des diffusions en direct sur une variété d’appareils. Au cours des six dernières années, Google s’est efforcé d’améliorer le processus de prise d’une vidéo téléchargée sur YouTube et de la transformer en 10 à 15 variantes avec différents formats de résolution et de compression.
Le mois dernier, Google mentionné il «doublait» le silicium personnalisé dans un effort pour «améliorer les performances et l’efficacité maintenant que la loi de Moore n’apporte plus d’améliorations rapides pour tout le monde». À cette fin, la société a embauché l’ancien responsable Intel du groupe de développement Core & Client, Uri Frank, pour diriger une équipe de conception de puces serveur en Israël.
Uri apporte 25 ans d’expérience dans la conception et la livraison de processeurs personnalisés, ce qui se révélera utile dans un certain nombre de projets Google, y compris un SoC personnalisé pour ses smartphones Pixel. La société se dit intéressée par une intégration plus approfondie entre le processeur, la mise en réseau, le stockage, la mémoire et divers accélérateurs pour le transcodage vidéo, l’apprentissage automatique, le cryptage, la compression, la synthèse sécurisée des données et la communication à distance.
L’objectif final est d’obtenir des performances plus élevées dans diverses charges de travail avec moins de consommation d’énergie et un coût total de possession inférieur, ce qui est encore plus apparent au niveau du centre de données que, par exemple, un appareil grand public. Par exemple, Google en 2018 a commencé à employer « Argos«Unités de codage vidéo (VCU) pour accélérer le transcodage vidéo des vidéos téléchargées sur YouTube, et nous en savons maintenant plus sur ces nouveaux systèmes.
Le transcodage n’est pas une mince affaire pour l’entreprise, car les utilisateurs occasionnels et les créateurs téléchargent plus de 500 heures de contenu vidéo par minute, et les gens passent plus de temps à regarder des vidéos et des diffusions en direct chaque année. Traditionnellement, l’infrastructure de YouTube reposait sur le transcodage basé sur le processeur pour compresser les vidéos afin d’envoyer la plus petite quantité possible de données à votre appareil avec la meilleure qualité possible, ce qui était coûteux, lent et inefficace.
Par comparaison, l’introduction des VCU Argos amené une augmentation des performances de 20 à 33 fois par rapport à la solution précédente de Google qui reposait sur un transcodage logiciel bien réglé sur des serveurs traditionnels. Le VCU de la société est une carte PCIe pleine longueur qui héberge deux puces Argos refroidies par un dissipateur thermique en aluminium plutôt grand, et semble n’avoir besoin que d’un seul connecteur d’alimentation à 8 broches pour une puissance supplémentaire, similaire à ce que nous voyons généralement sur les cartes graphiques de milieu de gamme. .
Chaque puce Argos possède 10 cœurs qui, selon Google, sont des «cœurs IP prêts à l’emploi» qui se connectent à six puces RAM LPDDR4-3200 externes sur quatre canaux, pour une capacité totale de 8 Go dédiée à chaque ASIC Argos. Chaque cœur est capable d’encoder une source 2160p en temps réel jusqu’à 60 images par seconde en utilisant trois images de référence. Malgré tout, aussi puissants que soient les VCU Argos, Google ne les déploie que dans un cluster relativement petit de machines dédiées à l’intérieur du système de serveur existant de YouTube, basé sur les processeurs Intel Skylake et les GPU Nvidia T4 Tensor Core.
Google ne perd jamais une occasion de vanter les vertus de son codec VP9, et comment il se compare favorablement en termes de qualité vidéo à H264. Cette fois, ce n’est pas différent, mais la société a admis qu’il fallait cinq fois plus de ressources matérielles pour encoder, c’est pourquoi elle a passé les six dernières années à améliorer l’infrastructure de YouTube avec des accélérateurs de transcodage personnalisés.
Un VPU Argos de deuxième génération est déjà en préparation, avec la prise en charge du codec AV1 qui offre jusqu’à 30% de compression en plus par rapport à VP9 avec une perte de qualité imperceptible. AV1 nécessite encore plus de puissance informatique pour encoder (ainsi que pour décoder pour la lecture), mais il bénéficie du soutien de plusieurs sociétés, notamment Amazon, Netflix, Microsoft, Mozilla, Qualcomm, MediaTek et même Apple – qui a été relativement lent avec l’adoption du codec et récemment ajouté la prise en charge de VP9 sur macOS Big Sur 11.3.
Google espère que la fourniture de plus d’encodages AV1 sur YouTube encouragera les fabricants de matériel à inclure le décodage accéléré par le matériel dans les nouvelles puces, résolvant potentiellement le problème de la poule et de l’œuf dans le cas de ce codec.