wiki:CompteRendu/cr2005/cr23_06

compte rendu de la réunion thématique développement durable du 23 juin 2005

DIRAC : le système de production et d'analyse de LHCb

(thème introduit par Vincent Garonne)

DIRAC (Distributed Infrastructure with Remote Agent Control) a pour ambition de constituer un système de production et d'analyse pour l'expérience LHCb qui intégrerait en un seul système distribué un maximum de ressources disponible, que ce soit la _Grille_ LCG (attachée au LHC) ou différents sites de calcul, quelle qu'en soit la nature. Un test a été effectué lors d'un "Data Challenge" en 2004 : le système a assumé 5500 tâches simultanées sur 60 sites (80 TO de données produites; 425 CPU années).

La solution explorée est serait une fusion entre une solution "institutionnelle" (Grille...) et une solution "communautaire" (Calcul global, _XtremWeb_ par exemple) rassemblant les avantages respectifs des deux solution tout en en minimisant les inconvénients autant que possible. L'idée générale est de "virtualiser" l'ensemble en s'appuyant sur une architecture orientée "service", c'est-à-dire fondée sur la notion de fonctionalité.

La discussion fait apparaître le fait que se développent maintenant de nombreuses recherches dans ce domaine du calcul distribué : Grille, open Science Grid, Glite, XtremWeb etc.... Toutes ces approches auront à converger, d'autant plus que, dans l'état actuel des choses, sinon des conflits, du moins des problèmes de coordination, peuvent se faire jour entre deux tels systèmes présents sur un site donné.

Un autre point de discussion a concerné les doutes qui peuvent naître, justifiés par les complications introduites, notamment dans la localisation des fichiers et bases de données. Une préoccupation exprimée est de restaurer une certaine notion d'interactivité pour l'analyse des données dans des systèmes essentiellement conçus, au départ, dans l'esprit "batch".

Last modified 18 years ago Last modified on Sep 24, 2006, 6:07:36 PM