wiki:Utilisation/EGEEStatus

Informations sur l'Etat de la Grille

Cette page décrit les différentes sources d'information permettant de connaitre l'état de la grille ou d'une ressource en particulier.

Annonce des Evènements pour Chaque Site

Au niveau de la grille EGEE/LCG, il existe un service de diffusion d'annonce des problèmes opérationnels, EGEE Broadcast. On peut souscire à ce service en indiquant la catégorie (par exemple, la VO) pour laquelle on souhaite être notifié. Ce sont des listes assez verbeuses... L'inscription dans ces listes est normalement faite lors de la souscription à la VO. Suivant les VOs, cette appartenance est obligatoire ou facultative et parfois modifiable après la souscription initiale. Regarder la procédure d'enregistrement dans la VO.

Il existe aussi une liste pour les utilisateurs locaux de GRIF qui permet de recevoir les annonces des évènements GRIF uniquement, sans avoir à souscrire à la liste générale. Pour souscrire à cette liste, grif-annonce-l@in2p3.fr, et consulter les archives, cliquer ici.

Etat d'une Ressource

Pour connaitre l'état des ressources de la grille EGEE/LCG, il faut consulter le portail SAM (Service Availability Monitoring) qui affiche le résultat et l'historique des tests des services grilles de l'ensemble de la grille EGEE/LCG. Ces tests sont exécutés une fois par heure, en permanence. On peut avoir une vue à la fois générale et par VO. Le test le plus significatif est celui de la VO ops.

Il existe plusieurs points d'entrée au portail SAM suivant les ressources auxquelles on s'intéresse :

Ces pages affichent un status Vert/Orange/Rouge pour chaque site avec un détail du service qui a causé un warning ou une error, le cas échéant.

Il est possible de s'abonner à des alarmes sur les problèmes d'un site ou d'une ressource particulière sur le site CIC Portal. Dans ce cas, vous pouvez recevoir un mail dès que la ressource ou le site concerné à un problème détecté par le monitoring.

Par ailleurs, il est possible de connaitre les problèmes en cours sur les ressources GRIF en utilisant GGUS.

Utilisation d'une Ressource

Il est possible de connaitre l'utilisation en temps réel d'une ressource (1 CE) ou l'historique de son utilisation (Accounting).

Utilisation en Temp Réel

Le principal service de monitoring de l'utilisation courante d'une ressource de la grille est GRIDIce. L'information principale concerne le nombre de jobs en cours d'exécution et en attente par VO. Dans l'information affichée, il ne faut pas attacher trop d'importance au nombre de Free Slots qui ne reflètent pas toujours la réalité (en particulier dans GRIF). Les principaux points d'entrée dans GRIDIce sont :

Il existe un autre d'outil de visualisation de l'état des ressources de la grille, plus graphique, mais aussi moins précis du fait de son mode de collection des données, Real Time Monitor.

Enfin, il est possible d'avoir une information soit sur l'état courant, soit sur l'historique tant pour les jobs que pour les data transfers au niveau général de la grille ou à celui d'une région ou d'un site avec le service GridView

Accounting

Il est possible de connaitre l'historique de l'utilisation d'une ressource via le GOC Accounting, qui est un accounting général (non VO dépendant) au niveau de la grille :

Il existe aussi des accountings par VO, en particulier :

Last modified 15 years ago Last modified on Jun 24, 2009, 9:58:59 AM