L’Observatoire SKA (SKAO) offrira aux scientifiques des données dont la qualité, la quantité et la variété iront bien au-delà de tout ce que fournissent les radiotélescopes actuels. Afin de préparer la communauté scientifique, SKAO organise des défis autour des données (« Data Challenges » ou « SDC ») entre des équipes scientifiques du monde entier. Pour la deuxième édition qui s’est déroulée cette année, une équipe française menée par l’Observatoire de Paris - PSL, en collaboration avec le CNRS, l’Observatoire de la Côte d’Azur et plusieurs universités françaises, ont remporté la médaille d’or de la compétition en utilisant le supercalculateur Jean Zay de GENCI/IDRIS.
Dans le cadre de la préparation à l'exploitation scientifique de l'Observatoire SKA (SKAO), les Data Challenges de SKAO (SDCs) sont conçus pour préparer les futurs utilisateurs à traiter efficacement les données de l’Observatoire SKA, afin qu'elles puissent être exploitées à leur plein potentiel dès que les télescopes entreront en phase d'exploitation initiale, et afin de stimuler le développement de techniques d'analyse des données. Les SDCs aident également l'Observatoire SKAO et ses partenaires dans le domaine de l’informatique à préparer les systèmes et processus nécessaires au réseau de centres régionaux SKA (SRC) qui stockeront, traiteront et fourniront un accès aux données aux astronomes du monde entier.
Quarante équipes composées de 280 participants provenant de 22 pays différents ont participé à cette deuxième édition des Data Challenges de SKA (SDC2) qui a débuté en février dernier et qui a duré six mois. Ils ont été soutenus par huit grands centres de calcul à travers le monde, fournissant des ressources de stockage et de traitements indispensables au bon déroulement des défis.
Les équipes avaient pour tâche de développer des algorithmes capables d’identifier et de caractériser près de 250 000 galaxies dans un cube de données de taille 1 To, issu d’une observation simulée de SKAO en spectro-imagerie dans la gamme de longueurs d'onde autour de la raie à 21cm de l’atome d’hydrogène. Les équipes ont été notées sur deux éléments qui, combinés, ont donné le score final du SDC2. Ces deux éléments ont été le nombre d’objets identifiés (avec une pénalité pour les faux positifs) et la précision avec laquelle les différentes caractéristiques des objets, par exemple leur taille ou leur luminosité, ont été mesurées.
Le 13 octobre 2021, SKAO a annoncé que le SDC2 a été remporté par une équipe française ayant bénéficié du projet MINERVA financé par l’Observatoire de Paris – PSL et utilisant les ressources du supercalculateur national français Jean Zay de GENCI exploité par l'Institut du Développement et des Ressources en Informatique Scientifique (IDRIS) du CNRS. L’objectif du projet MINERVA est d’explorer l’utilisation de l’apprentissage automatique dans divers domaines de la radioastronomie, avec une attention particulière sur la préparation de SKAO. « Je suis très fière des résultats de MINERVA pour SDC2. La Radioastronomie est l’une des grandes priorités de l’Observatoire de Paris-PSL, sa station de radioastronomie à Nançay accueillant deux des éclaireurs de SKA :
- la station internationale FR606 LOFAR
- le réseau NenuFAR ().
Les méthodes développées dans le cadre du projet MINERVA sont très innovantes et prometteuses, j’attends avec impatience un développement futur », déclare Fabienne Casoli, Présidente de l’Observatoire de Paris-PSL. L’équipe gagnante était également composée de collaborateurs de l’Université de Toronto et de l’Observatoire Astronomique de Strasbourg.
L’équipe a remporté le SDC2 en développant deux pipelines en parallèle, tous deux s’appuyant sur les réseaux neuronaux convolutifs (CNN) :
La première est une version améliorée du détecteur d’objets YOLO, adaptée aux besoins spécifiques des données astronomiques et généralisée en 3D, tandis que la seconde est une combinaison de plusieurs réseaux ad hoc mis en oeuvre uniquement pour le SDC2. La fusion des catalogues résultant de ces deux NC a donné le score le plus élevé du SDC2.
Le développement de l’algorithme a été réalisé sur des ressources locales à l’Observatoire de Paris - PSL, tandis que le traitement du cube de données de
1 To SDC2 complet a été effectué sur l’ordinateur Jean Zay de l’IDRIS en utilisant jusqu’à 25 GPU simultanément.
« C’est un grand plaisir de voir les interactions entre les astronomes et les informaticiens dans nos laboratoires, encouragées par le projet SKA. Les défis posés par la radioastronomie attirent de plus en plus l’attention de la communauté des informaticiens. Le CNRS, doté de solides capacités interdisciplinaires, est en très bonne position pour apporter les développements importants nécessaires à l’avènement et au succès de SKA », déclare Antoine Petit, Président-Directeur Général du CNRS.
Le supercalculateur français Jean Zay, propriété de GENCI (Grand Equipement National du Calcul Intensif), hébergé et exploité par l’IDRIS (CNRS), est l’un des plus puissants supercalculateurs européens opérationnels faisant converger calcul intensif (HPC) et intelligence artificielle (IA ; 28 PFlop/s).
Ce succès est une immense source de fierté pour GENCI et IDRIS qui se sont engagés à soutenir SKA-France et SKAO depuis mi-2020, avec des ressources informatiques accordées à quatre équipes de projet internationales sur 40 au total. Au cours de ce défi, ces quatre projets ont bénéficié d’un soutien dédié des équipes « d’IDRIS AI » et de « HPC User Support », couvrant tous les aspects, de la procédure administrative et sécurisée à l’accès au supercalculateur, aux questions plus techniques posées par les utilisateurs pour maîtriser l’usage de Jean Zay. Outre les ressources informatiques et humaines mises à disposition par GENCI et l’IDRIS, un ingénieur de recherche de l’Observatoire de la Côte d’Azur (OCA) a accompagné les utilisateurs du SDC2 dans les différentes étapes du défi. L’OCA a été le point d’entrée vers le supercalculateur.
Infographie représentant la participation au Science Data Challenge 2 du SKAO. Au total, 40 équipes comprenant 280 participants de 22 pays ont pris part à ce défi de 6 mois. Elles ont été soutenues par huit installations informatiques pour identifier et caractériser près de 250 000 galaxies dans un cube de données simulé de 1 To. Crédit : SKAO
« Alors que 1 000 heures de ressources informatiques GPU ont été allouées par l’IDRIS au projet MINERVA pour permettre le développement d’une méthode d’apprentissage automatique afin de mieux répondre aux besoins des images astronomiques, ce succès annonce des développements futurs très prometteurs entre HPC/AI et des instruments scientifiques de grande envergure dans le cadre du projet SKA, conformément au plan stratégique de GENCI », déclare Philippe Lavocat, Président Directeur Général de GENCI.
« La participation de la France au SDC2 est un bel exemple d’efforts communs que nous visons en coordonnant les activités liées à SKA en France », déclare le Dr Chiara Ferrari, directrice de SKA-France et astronome à l’OCA. « La collaboration d’astronomes, de développeurs, d’ingénieurs de différents instituts de recherche et d’infrastructures sera primordiale pour la future organisation des centres régionaux SKA, le réseau mondial d’infrastructures informatiques et de données qui permettra aux astronomes d’accéder aux produits scientifiques de l’Observatoire SKA et de les exploiter pleinement ».
A propos de SKAO
Le projet SKA sera l’une des plus grandes machines construites sur Terre. Les instruments de cet observatoire en radioastronomie ont été conçus entre 2012 et 2020 par SKA Organisation, une entreprise regroupant des membres de 14 pays (dont le CNRS) et des collaborations avec une centaine d’organisations de plus de 20 pays.
Aujourd’hui, c’est une organisation intergouvernementale dont le siège se trouve au Royaume-Uni, l’Observatoire SKA (SKAO), qui gère la construction et l’exploitation des télescopes et des infrastructures nécessaires pour fournir aux astrophysiciens les données scientifiques à analyser. Parmi ces dernières, nous mentionnons les supercalculateurs HPC qui feront partie intégrante du SKAO.
La construction de SKAO a officiellement commencé le 1er juillet 2021. Le résultat sera un observatoire exploitant deux télescopes composés de grands réseaux d’antennes (plus de 131 000 antennes en Australie, SKA-LOW, et un peu moins de 200 antennes paraboliques d’environ 15 m de diamètre en Afrique du Sud - SKA-MID), capable de capter globalement le rayonnement électromagnétique émis par les objets célestes entre 50 MHz et 15,4 GHz. Au cours des prochaines décennies, cet observatoire permettra des découvertes fondamentales en cosmologie, en astronomie et en physique fondamentale.
La position de la France au sein de SKAO a considérablement évolué ces dernières années et la France est en train de devenir un acteur à part entière de ce projet planétaire. Suite aux travaux préalables de SKA-France (une coordination nationale dirigée par le CNRS des activités industrielles, techniques et scientifiques préparatoire à la participation de la France au projet SKA), le Ministère français de l’Enseignement supérieur, de la Recherche et de l’Innovation (MESRI) a annoncé l’engagement de la France dans le processus de candidature à l’Observatoire SKA lors de la première réunion du Conseil SKAO, le 4 février 2021. En mai 2021, une décision unanime du Conseil de SKAO fait de la France le premier pays à rejoindre l’Observatoire au-delà de ses sept membres fondateurs (Australie, Chine, Italie, Pays-Bas, Portugal, Afrique du Sud et Royaume-Uni). L’annonce de l’adhésion de la France à l’Observatoire SKA a été faite par le Président français Emmanuel Macron à l’occasion de sa visite d’Etat en Afrique du Sud, lors de la conférence de presse tenue avec le Président sud-africain Cyril Ramaphosa le 28 mai 2021. Le processus de ratification de l’adhésion est en cours.
Liste des laboratoires de recherche impliqués dans la participation française au SDC2 :
- Laboratoire d'étude du rayonnement et de la matière en astrophysique et atmosphères (Observatoire de Paris - PSL/CNRS/Sorbonne Université/CY Cergy Paris Université),
- Laboratoire Galaxies, Etoiles, Physique, Instrumentation (Observatoire de Paris - PSL/CNRS)
- Observatoire astronomique de Strasbourg (CNRS/Université de Strasbourg)
- Institut du Développement et des Ressources en Informatique Scientifique (IDRIS-CNRS)
- UAR Galilée (Université Côte d'Azur, Observatoire de la Côte d'Azur, CNRS)
Pour en savoir plus
News parue sur le site de SKAO : « Second SKAO Science Data Challenge concludes with strong collaboration and innovation »