wiki:CompteRendu/cr2005/cr03_02

compte-rendu de la réunion développement durable du 3 février 2005

Nouvelles

Un bref compte-rendu est fait de la réunion du « comité de pilotage » du service consacrée au passage du service au « tourniquet » de la commission 03 du CNRS, auquel le laboratoire est, cette année, soumis.

Guy Barrand signale un « sursaut GEANT4 », programme de simulation de particules dans la matière, réinstallé à la demande de physiciens du laboratoire. Une aide légère devrait être assurée.

Discussion

L’exposé, par Jean-Noël Albert, est consacré à un compte-rendu de l’atelier « SGSD-2005 » qui s’est tenu à Lyon les 31 janvier et premier février.

Le groupe « systèmes de gestion de données en astroparticules » regroupe des personnes ( LAL, PCC/APC, CEA-DAPNIA, CC-IN2P3…) impliquées à divers titres dans des expériences d’astroparticules (Eros, Auger, Planck, snls…) dans le but d’évaluer, en dehors des contraintes de chaque expérience particulière, des propositions de systèmes de gestion de données tenant compte des aspects spécifiques du domaine « astroparticules ». Même si les futures expériences d’astroparticules auront à manipuler un volume de données (de l’ordre de 100 To) plus important que l’habitude en astronomie, ce volume reste néanmoins très faible par rapport à celui qui est prévu pour LHC (par exemple, ATLAS : 10 peta-octets). En revanche, contrairement à la culture de la physique des particules, ces données doivent souvent (Planck, par exemple) être rendues disponibles à la communauté scientifique internationale dans un délai bref et rester accessibles au fil du temps, ce qui implique un travail sur les standards de formats de données. Le groupe SGSD-A est une réponse à une proposition de programme interdisciplinaire en astroparticules. Plusieurs réunions ont eu lieu en 2004 afin de confronter les expériences (http://sgsda.lal.in2p3.fr).

À cet atelier de Lyon, participaient 4 ingénieurs et un physicien du LAL, parmi 15 participants (LAL, IAS, APC, CEA, CERN, CCIN2P3). Les thèmes suivants ont été abordés : formats de fichiers, bases de données, serveurs de données, Pool, Observatoire virtuel.

ROOT est un standard de persistance largement utilisé dans la communauté de la physique des particules (adopté par Atlas, Auger, Opéra etc.) Le format FITS (NASA), en revanche est traditionnel en astronomie, très utilisé, bien qu’un peu vieillot (orienté « tableaux »). Un nouveau format (HDF5), soutenu par la NASA et les agences spatiales, tente de supplanter FITS. À cela il faut ajouter des formats plus « maison » élaborés pour subvenir à des besoins immédiats en attendant les solutions définitives (Planck : PIOLib, Sophya…)

Pour ce qui concerne les bases de données, on retrouve les distinctions traditionnelles : bases relationnelles (Oracle, MySQL), bases objets (Objectivity, Versant) avec des solutions mixtes, ponts « objets-relationnels », utilisant l’approche objet avec une base de données relationnelle.

Bien que performant, le serveur (robot de cartouches) HPSS du CCPN présente néanmoins des inconvénients liés à la saturation éventuelle du système de caches. Il existe par ailleurs des serveurs de fichiers distribués (SRB). Une solution sera peut-être le serveur de données Xrootd.

Pool est la solution de stockage, gestion et accès aux données, pour LHC. Il n’est pas certain que cette solution, intégrant des volumes énormes de données, soit adaptée à l’astronomie et aux astroparticules. Pool adopte une communauté de démarche avec la Grille.

L’observatoire « virtuel » est un projet de structure visant à proposer à des clients-utilisateurs un accès à des données archivées ; le moyen en est la mise en connexion,au niveau mondial, des « systèmes d’information » des différents observatoire. L’efficacité du système repose sur une standardisation des formats et des méthodes. Un exemple est le cas de EROS, qui peut mettre à disposition un ensemble extrêmement riche d’images dont l’intérêt dépasse le but proprement dit de l’expérience elle-même.

En conclusion, la pérennité du groupe SGSDA dépend de la continuité du financement en 2005 par une proposition de programme interdisciplinaire (PIAP). Il s’agirait alors de définir un « guide Michelin » des solutions pour le stockage et la gestion des données, ainsi que pour l’accès à ces données, dans le domaine des astroparticules, sous la forme d’un modèle réaliste d’expérience avec différents cas de productions et différentes solutions évaluées.

Prochaine réunion

Le temps a manqué pour réaliser le tour de table prévu. On décide de le reporter à la réunion prochaine qui se tiendra dans une quinzaine. D’ici-là chacun est censé me faire parvenir des propositions ou souhaits pour des thèmes de discussion.

Liens

Site SGSD-A

présentation du thème

Last modified 18 years ago Last modified on Sep 24, 2006, 6:02:05 PM