Reportage à Strasbourg, où est stockée la mémoire mondiale du ciel

Ce bâtiment vitré abrite le Centre de données de Strasbourg, mémoire mondiale du ciel. © P. A. Duc/Obs. de Strasbourg
Le Centre de données de Strasbourg recueille l’ensemble des images et des mesures collectées par les grands observatoires et en fournit l’accès aux professionnels comme aux amateurs. Un service unique dans le monde.

Dans l’ombre d’un jardin arboré se dessine la grande coupole en fer de l’observatoire de Strasbourg, construit dans un style néo-classique sous l’occupation allemande entre 1876 et 1880. Si le hall a gardé son aura historique, entre pierres sculptées et hauts plafonds, d’étranges câbles multicolores serpentent le long du plafond de l’une des salles méridiennes. Quand on suit les racks fixés à même la pierre blanche, ils mènent jusqu’à une porte métallique au sous-sol : la salle de serveurs, le cœur actif du Centre de données de Strasbourg (CDS)

Derrière cette porte anonyme se cache le cerveau du CDS. Attention au bruit ! © J. Kern/CDS

Comme un saut dans le temps, on quitte la tranquillité du vénérable bâtiment pour une pièce sans fenêtre, où le bruit des ventilateurs vous assourdit comme une dizaine d’aspirateurs allumés en même temps : “La climatisation est indispensable, sinon les serveurs surchauffent au bout d’une heure”, explique Christophe Vaillard, informaticien au CDS. La température, maintenue en permanence à 20 °C, augmente sensiblement lorsqu’on s’approche de l’arrière des machines, là où le réseau de câbles est connecté. En plus d’un souffle, les unités centrales sont dotées d’une multitude d’yeux matérialisés par des diodes multicolores qui clignotent sans arrêt. Ces machines abritent le précieux butin du CDS : 1 pétaoctet de données astronomiques (1 Po égale 1015 octets, soit 1 000 To ou un million de gigaoctets.). C’est comme si vous aviez besoin de 2 000 PC portables pour stocker toutes vos photos de vacances !

Des millions de requêtes y sont traitées chaque jour par le CDS (Centre de données de Strasbourg). La quantité de données stockées
dans ses serveurs double tous les deux mois. © J. Kern/C&E

Ces données sont récoltées depuis la création du CDS au début des années 1970. Une naissance qui marque aussi l’entrée dans une seconde vie pour l’observatoire alsacien alors quasi centenaire. La lunette de Strasbourg — 48 cm de diamètre, 7 m de focale — était la plus grande de France à sa construction en 1877, puis la troisième après l’avènement de celles de Nice et de Meudon. Mais sa localisation en plein centre-ville limite rapidement ses capacités. Sa dernière utilisation professionnelle a eu lieu dans les années 1960. L’observatoire de Strasbourg réoriente alors ses activités vers la gestion de données stellaires. En 1988, la première liaison web transatlantique a lieu entre le CDS et les États-Unis. Aujourd’hui, le CDS mobilise la moitié de l’effectif total du site, c’est-à-dire 30 personnes à temps plein réparties en plusieurs spécialités : astronomes, documentalistes, ingénieurs et informaticiens. D’abord cantonnés aux étoiles, les catalogues du CDS regroupent maintenant tous les types d’objets célestes (hors Système solaire). Environ un million de requêtes sont comptabilisées chaque jour car, en plus de stocker les données, le CDS les partage avec les astronomes, professionnels ou amateurs, du monde entier qui viennent s’en nourrir via une plateforme web. Celle-ci donne accès à trois services : la base de données Simbad, le recueil de catalogues astronomiques Vizier et l’atlas du ciel Aladin.

Simbad, bibliothèque céleste

À quelques pas de là, au premier étage se trouve le bureau de Mark Allen, directeur du CDS dans lequel Sébastien Derrière, un astronome de l’équipe réveille le moniteur accroché au mur. Déjà la quantité d’informations affichée sur la page d’accueil donne le tournis : “Nous allons créer des tutoriels sur YouTube pour expliquer aux utilisateurs comment se servir de nos services”, rassure Sébastien Derriere. Simbad, l’outil le plus ancien puisque lancé en 1972, est comme une grande bibliothèque qui regroupe plus de 12 000 catalogues. “Si je tape M101 par exemple, j’obtiens la liste des articles scientifiques dans lesquels l’objet est mentionné, en plus des données de base”, explique Mark Allen, avec son fort accent anglais. Plus de 2 000 résultats bibliographiques sur la galaxie du Moulinet, située dans la Grande Ourse, apparaissent à l’écran aussi rapidement qu’une recherche Google. “Simbad tient sur un disque dur, mais il est très précieux”, ajoute Mark Allen. Chacun des 2 000 résultats est lié à une page présentant le titre de l’article, ses auteurs, son résumé, le nombre d’objets mentionnés, ainsi qu’un lien vers la publication complète. C’est dans les bureaux voisins que ce travail est assuré par des documentalistes qui lisent plusieurs publications scientifiques par jour pour y trouver les mentions des astres présents dans les bases de données. Ils sont assistés dans leur tâche par des logiciels, mais Mark Allen insiste sur le fait que “l’œil humain est indispensable”. Au moindre doute, ils peuvent faire appel à un astronome pour qu’il vérifie la nature de l’objet ou une donnée qui paraît aberrante. Simbad recueille à lui seul la moitié du million de requêtes journalières recensé par le CDS. 

Vizier, un océan de données

Quant à Vizier, c’est un océan à la profondeur insondable. L’utilisateur peut naviguer dans les 26 milliards de lignes de données cosmiques, par exemple la magnitude ou la position, réparties dans 18 000 catalogues différents. En quelques mouvements de souris, la recherche peut être affinée selon la mission ou le type de données. “Nous recevons ces données par réseaux, mais parfois aussi sur un simple disque dur envoyé par la Poste”, note Sébastien Derriere. Là encore, le travail des documentalistes est précieux. Ils rendent ces données lisibles en mettant en forme les tables et en les vérifiant avec l’aide des astronomes. “Nous avons reçu en avance le deuxième catalogue de la mission astrométrique Gaia, car nos trois documentalistes ont mis trois semaines et demie pour traiter 1,7 milliard de lignes du catalogue. D’ailleurs, nous avons eu un pic de requêtes pour ce catalogue, plus de 6 millions durant le mois de sa parution”, raconte Sébastien Derriere. En conservant l’exemple de M 101, après une recherche Vizier, il apparaît dans treize catalogues et rien que le premier possède 539 825 lignes de données. Si déjà, la quantité de données que regroupent ces deux services semble conséquente, elles ne représentent pourtant qu’une quinzaine de téraoctets (To) sur les 700 disponibles sur les serveurs (les 300 restants sont alloués aux sauvegardes).

Aladin, la magie de l’image

Ce sont les images qui prennent le plus de place sur les serveurs : “Il faut à peu près 1 To de données pour créer une image complète du ciel de bonne qualité”, indique Sébastien Derriere. La collection d’images du CDS, baptisée Aladin, compte environ 300 relevés complets du ciel réalisés par des télescopes comme le chasseur d’astéroïdes Pan-Starrs ou le satellite Spitzer. Alors que les images ne montrent habituellement qu’un seul objet isolé, le CDS a créé une mosaïque complète du ciel montrant l’objet de son environnement. L’ensemble des cartes générées forme un véritable observatoire virtuel ! Le résultat est saisissant, les images apparaissent nettes sans perte d’information, parfois jusqu’au pixel. Contempler l’objet ainsi sur un fond étoilé donne l’impression de l’observer de ses propres yeux dans l’oculaire d’un grand télescope. Cette prouesse est possible grâce à la création de HiPS (Hierarchical Progressive Surveys) qui permet de conserver le maximum d’informations sur l’image, quel que soit le niveau de zoom. Le nombre de données mobilisées pour une carte peut être conséquent : “Nous avons 15 To de données pour un seul filtre pour Pan-Starrs, par exemple. C’est impossible d’afficher tout cela en une fois”, souligne Sébastien Derriere. 

Les trois outils du CDS — Simbad (base de données), Vizier (base de catalogues célestes) et Aladin (banque d’images) — permettent d’accéder
à l’ensemble des connaissances astronomiques (ci-dessous, le ciel vu par le satellite Gaia). © ESA/DPAC

Le ciel est découpé selon un protocole mis au point au CDS et utilisé par d’autres serveurs qui partagent leurs données avec Strasbourg. À chaque fois que l’on progresse dans l’image, une quantité d’informations raisonnable est affichée à l’écran permettant de toujours obtenir un visuel résolu. “C’est la version ‘lite’ d’Aladin, il existe aussi Aladin Desktop, qui permet d’aller encore plus loin”, annonce Mark Allen. Ce logiciel permet d’afficher simultanément deux cartes complètes du ciel synchronisées, mais aussi d’accéder à des données hébergées ailleurs qu’à Strasbourg, comme des images du télescope Hubble.

Ces trois services ne sont pas isolés les uns des autres : Simbad affiche les caractéristiques générales d’un astre stockées dans Vizier, et un aperçu de l’objet est géré par Aladin. De plus, une recherche commune aux différents catalogues est réalisable. Il est tout à fait possible de croiser le milliard et quelques de données Gaia avec les 15 To du catalogue Pan-Starrs. Il faudra alors patienter une petite heure avant d’obtenir un fichier de résultats téléchargeable. Les astronomes peuvent également comparer leurs propres données avec celles hébergées par le CDS. À l’image du nombre de données difficilement concevable, les possibilités de recherche et de découverte semblent, elles aussi, infinies. 

On pourrait penser que cette mine d’or de connaissances scientifiques est lourdement protégée des cyberattaques. Il n’en est rien ! Un simple pare-feu et un serveur sécurisé les protègent. La connexion internet est celle de l’université de Strasbourg. Des programmes testent régulièrement l’état des services et notifient tout problème aux responsables. Chaque service possède un “miroir”, c’est-à-dire son double stocké dans un autre centre de données. Simbad a le sien à Harvard, Vizier en possède sept à travers le monde. Si le centre alsacien rencontre une panne, ces miroirs prennent le relais pour assurer le service : “Les pannes imprévues sont rares. Quand on sait qu’on doit couper le courant, on prévient les utilisateurs”, informe Mark Allen. Le nœud du problème est plus physique que virtuel. En effet, si une coupure d’électricité intempestive survient : les informaticiens doivent agir vite. “En cas de coupure, un onduleur prend le relais. Nous n’avons alors qu’une heure pour tout couper proprement”, explique Christophe Vaillard.

Le CDS grandit aussi vite qu’il avale des données. “La quantité de données double tous les 18 mois. Dans deux ans, nous atteindrons le seuil de 2 Po. Notre limite est fixée à 5 Po”, explique Mark Allen. Un futur centre construit à Strasbourg abritera les nouveaux serveurs du CDS, qui lui permettront de croître encore pour contenir les montagnes de 0 et de 1 collectées chaque nuit par les astronomes du monde entier. Mais le cœur vrombissant du CDS sera toujours logé dans une petite salle aveugle du sous-sol de l’observatoire plus que centenaire. 

 

Cet article est extrait du Ciel & Espace n° 561, de septembre-octobre 2018.

À lire également dans ce numéro :

  • L’Europe part explorer Mercure
  • Big data : l’ère des robots astronomes
  • Au XIXe siècle, L’aventure de la Carte du ciel
  • Espace : le Japon s’ouvre au monde
  • Alex Conu, photographe des grands espaces
  • Quand Lovecraft se rêvait en astronome
  • Test : une lunette d’initiation sur une monture nomade

 

Disponible en kiosque ou sur notre boutique web.

 

Recevez Ciel & Espace pour moins de 6€/mois

Et beaucoup d'autres avantages avec l'offre numérique.

Voir les offres

Nous avons sélectionné pour vous