Google a franchi une étape révolutionnaire dans l’infrastructure de l’intelligence artificielle et a annoncé la nouvelle génération d’architecture spéciale de TPU (Unité de traitement Tensoor). Ironwood, le TPU de la septième génération de l’entreprise, a été conçu pour répondre aux besoins avancés des modèles Gemini. Google dit que ce processeur effectue des tâches de niveau avancé telles que le raisonnement simulé. Le géant de la technologie appelle cette période comme l’âge de l’inférence ».
Google parle des modèles de Gémeaux de nouvelle génération, non seulement de l’architecture du modèle, mais aussi de l’infrastructure qui rend possible les performances de ces modèles. Au centre de cette infrastructure, Ironwood est maintenant situé. Avec ce processeur, l’entreprise déclare que les systèmes d’intelligence artificielle «de type agent» prendront de la force. Ces systèmes sont définis comme des structures qui peuvent collecter des données au nom de l’utilisateur, prendre des décisions et produire des sorties. En bref, Google annonce que l’intelligence artificielle évolue non seulement, mais aussi à une structure proactive.
Ironwood a été introduit comme le TPU le plus puissant et le plus évolutif. Chaque puce a une capacité de transaction jusqu’à 4 614 TFLOP par seconde. Ces puces peuvent communiquer directement via l’interconnexion inter-chip (ICI) de nouvelle génération développée par Google. De plus, ces processeurs peuvent travailler en regroupant jusqu’à 9,216 pièces avec leurs structures de refroidissement liquide. Cette structure géante peut atteindre un total de 42,5 puissance de calcul Exaflops. Les développeurs pourront utiliser ces processeurs de nouvelle génération dans deux configurations différentes: 256 serveurs de puces ou 9.216 Clusters en cours de capacité.
Les puces en bois de fer attirent l’attention non seulement avec la puissance de traitement, mais aussi avec la capacité de la mémoire. Chaque TPU est équipé de 192 Go de mémoire. Cela signifie une augmentation de 6 de l’étage par rapport au trillium de génération précédente (TPU V6). La bande passante de mémoire est également améliorée de 7,2 tbps 4,5 fois. De plus, la société souligne que Ironwood est deux fois plus efficace que Trillium en termes de performances par watt.
Même Google est si confiant dans Ironwood qu’il ne s’abstient même pas de faire des comparaisons controversées. La société affirme que Ironwood est 24 fois plus rapide qu’El Capitan, connu comme le super ordinateur le plus puissant du monde. Google fait cette comparaison sur le FP8, mais El Capitan propose 1,7 exaflops.
Ironwood de Google montre qu’une tendance récente se poursuivra sans relâche: indépendamment de Nvidia. Bien que Nvidia soit encore incontestable dans le secteur, le Trainium, Inferentia et Graviton d’Amazon sont; Les solutions de Microsoft comme Maia 100, et enfin Ironwood montrent que les géants de la technologie attachent une grande importance aux solutions internes.