Accueil / Actualités 2023       2024   2023   2022   2021   2020   2019   2018

Actualités

2023

20 novembre 2023
Le CEA DIF sur la scène internationale du HPC

Mi-novembre, les équipes du CEA/DAM ont participé à SuperComputing 23 à Denver (USA), le plus grand évènement international dédié au calcul intensif. Cet évènement a été l’occasion pour le CEA de présenter ses moyens techniques, son expertise en HPC, IA, calcul quantique, ou encore scientifique, ainsi que ses projets à venir. Le stand CEA a été le terrain de nombreux contacts et discussions, en cette année charnière où le CCRT (Centre de Calcul Recherche et Technologie) fête ses 20 ans de partenariats industriels, et où le projet Jules Verne de machine Exascale, qui sera installée au TGCC (Très Grand centre de calcul du CEA) à partir de 2025, a été sélectionné par EuroHPC.




Octobre 2023
Le CEA utilise l’IA pour surveiller son supercalculateur EXA1

La surveillance d'un centre de calcul comme celui d’EXA1 n'est pas une mince affaire. Les dizaines de milliers de serveurs et d'équipements qui le composent génèrent chacun des milliers d'indicateurs par seconde. Détecter une anomalie de fonctionnement parmi cette énorme quantité d’informations est ainsi un véritable défi, quasi irréalisable pour des opérateurs humains.

Pour faciliter cette supervision, la Direction des applications militaires du CEA développe un système de contrôle capable de surveiller tous les flux d'événements de son centre de calcul. Ce système est capable d'ingérer et analyser une immense quantité de données de monitoring (événements système, indicateurs de performance, de consommation énergétique...) et de détecter les situations anormales nécessitant une attention particulière. Avec l’aide d’algorithmes issus de l’Intelligence Artificielle (IA), ce système est non seulement capable d'indiquer précisément les parties de systèmes incriminées dans cette anomalie de fonctionnement (faisant gagner un temps précieux dans la recherche des causes et conséquences de la perturbation) mais aussi de détecter des problèmes difficiles à déceler, voire de les anticiper.

La première mise en œuvre de ce système concerne la surveillance des infrastructures d'alimentation électrique et de refroidissement du calculateur, où il a notamment permis d'identifier plusieurs anomalies telles que des irrégularités dans les systèmes de refroidissement, ou encore des erreurs de câblage du système d’alimentation, entraînant l’usage d’une puissance électrique anormale. Au-delà de la recherche d’anomalies, l’IA peut déterminer si l’une des configurations observées du système permet d’économiser de l’énergie sans dégrader ses performances.

Ces deux graphiques représentent respectivement la puissance électrique utilisée pour le calcul (en haut) et la puissance électrique fournie par l'un des onduleurs (en bas).
S’il est normal que les puissances électriques varient au cours du temps en fonction des calculs lancés, une IA permet de corréler facilement les mesures et de détecter les situations où ces indicateurs ne se comportent plus normalement.
Ici (segment vert sur le second graphique), l’algorithme met en évidence une surconsommation anormale sur l'onduleur. Le système émet alors un point d’attention aux opérateurs indiquant une situation anormale sur le second graphique. Dans le cas présent, ce comportement anormal était dû à une erreur de câblage.

Au vu de ces résultats prometteurs ce système va maintenant être appliqué à d'autres aspects de nos centres de calculs tels que la détection de pannes matérielles, l’optimisation de l’utilisation des ressources de calcul et de stockage, ou encore la recherche de failles de sécurité. À plus long terme, l’IA pourra être utilisée pour déterminer automatiquement la politique de gestion adéquate du centre de calcul : mode performant, économique (utile en cas de crise énergétique) ou encore dégradé suite à une défaillance.

En conclusion, la Direction des applications militaires du CEA a développé un système à base d’IA pour surveiller son supercalculateur EXA1, une avancée importante dans la gestion de centres de calcul de grande envergure. Ce système permet de détecter les anomalies de fonctionnement et de gagner du temps dans la recherche de leur origine. Cette innovation ouvre la voie à d'autres applications dans le domaine de la surveillance des infrastructures critiques, notamment dans les domaines de l'énergie et de la sécurité informatique. Il est également intéressant de noter qu’il pourrait être utilisé pour améliorer l'efficacité énergétique et réduire les coûts opérationnels dans les centres de calcul. Les possibles débouchés sont nombreux pour cette technologie, et il sera intéressant de suivre les développements futurs dans ce domaine.

Source:
« ML-based methodology for HPC facilities supervision », Laetitia Anton, Sophie Willemot, Sebastien Gougeaud (CEA, France) and Soraya Zertal (Univ of Versailles, France), ISC/MODA 2023
URL : https://link.springer.com/chapter/10.1007/978-3-031-40843-4_23

 



20 juin 2023
Décision de l'entreprise commune EuroHPC d'héberger et d'exploiter un nouveau supercalculateur européen Exascale en France au TGCC

L’entreprise commune européenne EuroHPC, a annoncé retenir, pour le deuxième supercalculateur européen Exascale, le projet porté en France par le consortium Jules Verne.

Ce consortium réunit la France, représentée par le Grand Equipement National de Calcul Intensif (GENCI) en tant qu'entité d’accueil (hosting entity), en collaboration avec le CEA en tant que site d’hébergement (hosting site), et les Pays-Bas, représentés par SURF, le centre national néerlandais de soutien au calcul intensif et distribué.

En savoir plus (CEA)
Site Euro HPC





ISC High Performance 23, Hambourg
Forum TERATEC 23, Paris
Mai 2023
Le CEA DIF mobilisé sur tous les fronts pour le HPC

Les équipes du CEA/DAM ont participé à ISC High Performance 2023 » à Hambourg (Allemagne), ainsi qu’au forum Teratec à Paris, pour présenter les savoir-faire et activités de la DAM dans le Calcul Haute Performance, les opportunités de partenariats avec les offres du Très Grand centre de calcul du CEA (TGCC) et du CCRT (Centre de Calcul Recherche et Technologie), et pour rencontrer toute la communauté scientifique et industrielle du domaine.




24 février 2023
NumPEx : lancement d’un plan d’investissement pour l’exascale

Co-piloté par le CEA, le CNRS et l’Inria, le programme et équipement prioritaire de recherche NumPEx (Numérique pour l’exascale, la future gamme de supercalculateurs «exaflopiques») a été officiellement lancé le 24 février 2023 au Très grand centre de calcul du CEA (TGCC) par Madame Sylvie Retailleau, ministre de l’Enseignement Supérieur et de la Recherche, et Jean-Noël Barrot, ministre délégué chargé de la Transition numérique et des Télécommunications.

En savoir plus

Engagés dans ce programme via la DRF et la DAM, les chercheurs du CEA et leurs partenaires ont assisté à plusieurs présentations sur l’enjeu des technologies « exascale » et sur les « briques » technologiques logicielles que ce programme d’investissement vise à concevoir et développer pour équiper les futures machines « exascale ». Les ministres ont également pu voir les supercalculateurs Joliot-Curie et Topaze, accompagnés par l’administrateur général du CEA, François Jacq, le directeur des applications militaires, Vincenzo Salvetti, et le directeur du centre DAM Île-de-France, Jean-Philippe Verger.