LMI MAG 2 Mars 2020 - Magazine - Page 27
La capacité de calcul du Jean Zay est multipliée par dix par rapport
au système Turing qu’il remplace.
Crédit : CNRS / Idris
système puisqu’il a la mission d’équiper à tour de rôle
en ressources HPC les trois centres nationaux pour la
simulation numérique (le CINES, le TGCC et l’Idris).
Tous les dix-huit mois, l’un de ces centres renouvellera
ses installations. « Le budget est déterminé à l’avance,
nous choisissons la meilleure offre technique », rappelle
Denis Girou. Le contrat avec HPE a été signé il y a un an,
pour un montant de 25 millions d’euros (auxquels s’ajouteront autant de coûts de fonctionnement sur cinq ou
six ans). Les deux précédents avaient été remportés par
IBM, le constructeur national Atos Bull équipant pour sa
part les deux autres centres nationaux.
250 projets, un millier d’utilisateurs
Gold 6248 sur architecture Cascade Lake) et une deuxième
partition constituée de 261 nœuds convergés hybrides
équipés de CPU et GPU (circuits graphiques Nvidia V100
SXM2 32 Go) pour des usages HPC et IA, décrit l’Idris,
premier centre national à intégrer ces possibilités combinées. Chaque nœud dispose de 192 Go de mémoire, le
stockage monte à 30 Po sur disques et 1 Po sur mémoire
flash (bientôt 1,2 Po) et l’interconnexion repose sur un
réseau Intel Omni-Path 100 Gb/s. La capacité de calcul
du Jean Zay est multipliée par dix par rapport au système Turing qu’il remplace. Au niveau mondial, le supercalculateur de l’Idris est 46e au classement Top500 des
systèmes HPC les plus puissants.
« L’essentiel du surcroît de puissance vient des accélérateurs avec plus d’un millier de GPU qui apportent
un facteur d’accélération considérable, de 2, 4 ou 10,
si les applications savent en tirer parti », pointe Denis
Girou, directeur de l’Idris pendant neuf ans, qui vient
tout juste de passer le témoin à Pierre-François Lavallée.
L’un des chantiers engagé est justement de porter le
code des applications pour qu’elles puissent pleinement
exploiter ces GPU. Depuis son installation, le Jean Zay
s’est déjà enrichi de 248 GPU supplémentaires grâce
aux 3 M€ donnés par Facebook à l’Etat dans le cadre du
programme AI for Humanity, dont le supercalculateur
fait partie. Hewlett-Packard Enterprise a été retenu
après un appel d’offres extrêmement compétitif conduit
par le CNRS et le GENCI (Grand équipement national
de calcul intensif), ce dernier étant le propriétaire du
Le Jean Zay a été installé entre avril et juillet 2019. Les
phases de qualification ont ensuite démarré, le rôle de
l’Idris étant de fournir une machine de production complètement stable avec un engagement de disponibilité de
98 %. Cette période de qualification a permis à certains
utilisateurs de profiter des ressources de la machine
avant qu’elle soit entièrement stable. Trente-cinq projets
sélectionnés ont ainsi pu pendant trois mois accéder de
façon privilégiée au supercalculateur en cours de stabilisation. L’ouverture à tous s’est faite en octobre. L’accès
à ces ressources CPU et GPU est gratuit avec en contrepartie l’obligation de publier les résultats des recherches
effectuées. Depuis un peu plus de trois mois, 250 projets
et 1 000 utilisateurs ont migré sur Jean Zay dont ceux de
la communauté IA à laquelle une partie des ressources
est consacrée avec de nouveaux modes d’allocation
du temps de calcul sur la machine. Pour les projets en
intelligence artificielle, cette allocation se fera « au fil
de l’eau » sans recourir aux habituels appels à projets
semestriels par lesquels passaient les utilisateurs de la
simulation numérique et des applications massivement
parallèles, notamment pour la recherche en climatologie,
astrophysique ou mécanique des fluides.
Désormais, le Jean Zay « peut s’adapter à la volée aux
deux communautés de chercheurs, HPC et IA », souligne
Jean-Philippe Proux, responsable des opérations chez
GENCI, lors d’un point presse pendant lequel quatre
chercheurs ont présenté les projets engagés et les bénéfices qu’ils attendaient du système.
27