Introduction et architecture

Après avoir vu son rival AMD recevoir des applaudissements enthousiastes pour le lancement de Ryzen après Ryzen à une cadence sans faille, l’empire, Intel, riposte en lançant des processeurs de bureau de 11e génération dotés de nouveaux processeurs et d’architectures GPU intégrées.

Architecture de bureau de base de 11e génération

Vous vous demandez peut-être de quoi il s’agit aujourd’hui, car la 11e génération Core a été annoncée depuis septembre 2020 et est déjà livrée dans les ordinateurs portables. C’est vrai, mais Intel sépare les architectures de bureau et mobiles, donnant la priorité à cette dernière cette fois-ci. Sur mobile, 11th Gen Core fait référence à des puces alimentées par l’architecture Tiger Lake construite sur 10 nm, tandis que l’implémentation de bureau est connue sous le nom de Rocket Lake (RKL-S) et fabriquée sur 14 nm.

Intel a publié des détails de haut niveau en janvier. Maintenant, nous pouvons regarder plus loin sous le capot et voir comment Rocket Lake est construit et, plus important encore pour les passionnés d’argent à dépenser cet été, comment il se compare à la légion Ryzen.

En se concentrant d’abord sur les cœurs du processeur, RKL-S est un peu un Frankenstein car il associe l’architecture moderne de Sunny Cove à l’ancien processus de fabrication de 14 nm. Sunny Cove est le successeur de Skylake et offre une amélioration d’environ 20% de l’IPC en ajoutant une capacité de traitement plus innée. En particulier, cœur pour cœur, Sunny Cove double la taille du cache L2 et augmente les données L1 (mais pas les instructions) et les caches micro-op de 50%, permettant à la puce de contenir un plus grand ensemble d’instructions par cycle. Intel fait référence à cela comme la machine devenant “ plus profonde ”, même si le cache L3 reste le même d’une génération à l’autre à 2 Mo par cœur.

Sunny Cove est également, en langage Intel, “ plus large ” car il améliore la largeur d’allocation du back-end et les ports d’exécution de 25%, tandis que le moteur d’exécution lui-même voit doubler les magasins de données et une unité de génération d’adresses supplémentaire. Si vous allez élargir la bête en haut, elle a besoin d’une largeur suffisante pour exécuter les instructions du milieu. Parallèlement à cela, la partie “ plus intelligente ” de l’architecture repose sur l’amélioration de la prédiction de branche et de la capacité de pré-extraction, nécessaires pour nourrir la bouche de la bête, dans notre analogie ténue de monstre.

Il est clair que Sunny Cove est une conception plus musclée dont la principale mission est d’améliorer l’IPC plutôt que de se concentrer sur la fréquence. Cette exposition marche sur un terrain plus ancien et familier, car les cœurs de processeur Sunny Cove sont déjà présents sur les processeurs mobiles Intel de 10e génération dotés de la technologie Ice Lake, qui sont une génération derrière Tiger Lake qui utilise les cœurs encore meilleurs de Willow Cove – oui, beaucoup de lacs et criques qui se combinent pour confondre.

Quoi qu’il en soit, et voici ce qui est important pour les passionnés de bureau, Intel a pris la décision d’utiliser sans doute des cœurs de processeur Sunny Cove de dernière génération, puis de rétroporter leur processus de production naturel de 10 nm à 14 nm qui existe sous une forme ou une autre depuis 2014. technologie de fabrication vraiment ancienne. On peut affirmer que les dernières techniques de processus 14 nm sont suffisamment différentes pour être considérées comme une étape intermédiaire, mais Intel reste fermement derrière la technologie dérivée de TSMC d’AMD qui utilise depuis un certain temps le 7 nm à économie d’espace et d’énergie.

Si Intel voulait vraiment que les processeurs de bureau de 11e génération brillent, il aurait utilisé Tiger Lake 10 nm SuperFin sous forme de cœur étendu. Pourquoi, alors, Intel a-t-il décidé de suivre cette voie entre l’ancien et l’ancien? Bonne question, et la réponse est des rendements sur le processus 10 nm.

Il est plus important pour Intel de maximiser son processus de pointe à volume limité pour les ordinateurs portables où le budget total est beaucoup plus préoccupant que sur les ordinateurs de bureau. Une partie de ce nouveau processus est également réservée aux serveurs à venir où la densité de cœur est essentielle. En rétroportant Sunny Cove sur un 14 nm établi et mature, même si cela ne va pas pour le passionné, Intel peut garantir une quantité définie de production pour répondre à une demande accrue. Ce backport de processus change le nom du cœur du processeur de Sunny Cove à Cypress Cove.

L’inconvénient évident de cette approche 14 nm est la limitation nécessaire du nombre de cœurs de processeur, d’autant plus que Sunny / Cypress Cove est fondamentalement plus grand que son prédécesseur et Intel persiste à intégrer des graphiques intégrés dans la plupart des puces de bureau. Ces graphiques prennent la forme du tout nouveau Xe-LP avec jusqu’à 32 unités d’exécution pour, selon Intel, jusqu’à 50% de performances en plus par rapport à la très ancienne génération UHD 630.

Ce backporting délibéré et forcé limite RKL-S à huit cœurs et 16 threads, contre 10C20T sur les puces Comet Lake-S actuelles. Intel affirme que les gains de l’IPC compenseront principalement le manque de performances dans les applications fortement threadées, tandis que le même IPC devrait permettre à cette génération de récupérer l’application à un seul thread et la couronne de framerate de jeu à des résolutions inférieures.

Même ainsi, Intel rate une astuce évidente dans les modèles non-IGP F-suffixe. Plutôt que de simplement désactiver la capacité graphique intégrée, la société aurait dû publier des modèles à processeur uniquement avec 10C20T, qui correspondent au moins à la topologie de la génération actuelle.

Pourtant, ce ne sont pas toutes des nouvelles sinistres. En dehors de l’architecture discutée, les nouveaux cœurs apportent des fonctionnalités supplémentaires. Pour la première fois sur le bureau client, il existe un sous-ensemble d’AVX-512 – ce qui signifie que les instructions peuvent s’exécuter sur des registres ultra-larges de 512 bits – qui sont les plus similaires aux capacités des puces mobiles Ice Lake, y compris VNNI utilisé par Deep Learning boost pour inférences d’apprentissage automatique plus rapides.

On peut facilement remettre en question la nécessité de l’AVX-512 sur le bureau pour plusieurs raisons convaincantes. Les PC clients n’ont guère besoin de traiter, par exemple, 32 opérations 16 bits d’un seul coup, ou un mélange enivrant de précision simple et double, ce qui entraîne la colère du dieu de la chaleur alors que le processeur fonctionne à plein régime. inclinaison. Aller à 512 registres prend naturellement plus d’espace de puce qui pourrait être mieux implémenté pour plus de cœurs ou de cache. Balançoires et ronds-points.

Parlant d’espace et de noyaux élargis, nos calculs suggèrent que la matrice à huit cœurs de 11e génération mesure environ 270 mm² et se compose de 6 milliards de transistors, contre environ 205 mm² et 4,2 milliards pour la 10e génération et 180 mm² pour la 9e génération correspondant au noyau et au filetage. N’oubliez pas que la 10e génération a également plus de cœurs, il est donc raisonnable de supposer que les cœurs RKL-S sont un peu plus gros. Cela explique en outre pourquoi Intel ne peut pas facilement exécuter des modèles à 10 ou 12 cœurs en utilisant cette architecture de processeur; il a été conçu avec 10 nm à l’esprit, pas 14 nm.

Leave a Reply