Changes between Version 48 and Version 49 of Tutorial/JobSubm


Ignore:
Timestamp:
Jun 6, 2008, 11:32:57 AM (17 years ago)
Author:
/C=FR/O=CNRS/OU=UMR8608/CN=Christophe Diarra/emailAddress=diarra@…
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • Tutorial/JobSubm

    v48 v49  
    484484fonctionnalité car elle est augmente la charge du WMS.
    485485
    486 Dans l'exemple ci-dessous nous allons lancer le job perusal.jdl et récupérer des fichiers pendant que le job tourne.
     486Dans l'exemple ci-dessous nous allons lancer le job perusal.jdl et récupérer des fichiers pendant que le job tourne. Il y a un upload toutes les 2 minutes (120 secondes) du WN vers le WMS.
    487487
    488488{{{
     
    499499}}}
    500500
     501N.B.: on peut utiliser l'attribut PerusalFilesDestURI dans le .jdl pour demander l'upload vers un serveur GridFTP plus que
     502que vers le WMS.
     503
    501504La soumission :
    502505
     
    535538
    536539Ici, le fichier se trouvera dans /home/diarra/JobOutput/diarra_1nX3gfh6Ba9NLtxy5FKe2g . Le nom du fichier contient en plus
    537 la fenêtre de temps couverte. A chaque récupération, un nouveau fichier est créé. Après plusieurs inspection des fichiers, on a par exemple :
     540la fenêtre de temps couverte. A chaque récupération, un nouveau fichier est créé. Après plusieurs inspections des fichiers, on a par exemple :
    538541
    539542
     
    568571                                                             
    569572=== Le renouvellement automatique de proxy ===
     573
     574Pour des raisons de sécurité, il est recommandé de ne pas crée des proxies de plusieurs jours. Par ailleurs la durée de l'extension VOMS du proxy est limitée par les VOs, en général à 24h. Si un job dure plus longtemps que la
     575validitée du proxy associé, il peut échouer ('Aborted' avec la raison 'the userproxy expired' ).
     576
     577Le serveur proxy permet d'enregistrer son proxy pour une longue durée. Le proxy enregistré peut ensuite servir au WMS pour renouveler automatiquement le proxy des jobs.
     578
     579Pour utiliser un service myproxy il faut :
     580 * Créer un proxy VOMS et l'enregistrer pour plusieurs jours ou semaines dans le serveur myproxy (myproxy.grif.fr pour GRIF)
     581 * Déclarer le serveur myproxy dans le .jdl. Par exemple mettre la ligne suivante dans le .jdl
     582
     583{{{
     584MyProxyServer = "myproxy.grif.fr";
     585}}}
     586
     587Avant d'enregistrer son proxy, en crér un valide :
     588
     589{{{
     590[diarra@ipngrid01 work]$ voms-proxy-init --voms vo.ipno.in2p3.fr --valid 24:00
     591}}}
     592
     593Pour supprimer un ancien proxy déjà enregistré dans le serveur myproxy :
     594
     595{{{
     596[diarra@ipngrid01 work]$ myproxy-destroy -s myproxy.grif.fr -d
     597}}}
     598
     599Pour enregistrer son proxy dans le serveir myprosy :
     600
     601{{{
     602[diarra@ipngrid01 work]$ myproxy-init -s myproxy.grif.fr -d -n -t 24 -c 800
     603}}}
     604
     605Les options :
     606
     607 * -d : Le DN sera utilisé par défaut comme le username
     608 * -n : On peut récupérer le proxy sans donner de mot de passe
     609 * -t : Validité (lifetime) en heures du proxy récupéré (délégué). La valeur par défaut est 12h.
     610 * -c : Validité (lifetime) en heures du proxy sur le serveur myproxy. La valeur par defaut est 1 semaine.
     611 
     612On vérifie avec myproxy-info :
     613
     614{{{
     615[diarra@ipngrid01 work]$ myproxy-info -s myproxy.grif.fr -d
     616username: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra
     617owner: /O=GRID-FR/C=FR/O=CNRS/OU=IPNO/CN=Christophe Diarra
     618  timeleft: 799:58:55  (33.3 days)
     619}}}
     620
     621Ensuite il suffit de soumettre un job avec un proxy VOMS valide. Même si le job dure plusieurs jours, son proxy
     622n'expirera pas. Bien sûr il faut que le temps d'exécution job n'excède la durée de vie totale du proxy enregistré sur le serveur myproxy.
     623
    570624=== Ressoumission automatique ===
    571625
     626Le WMS peut resoumettre automatiquement les jobs s'ils sont 'aborted' par la grille. Deux types de ressoumission sont disponibles en gLite 3.1 WMS:
     627 * deep resubmission : pour les jobs échouent qui après démarrage sur un WN
     628 * shallow resubmission : dans les autres cas
     629
     630Les attributes RetryCount et ShallowRetryCount permettent de limiter le nombre
     631de tentatives de ressoumission des jobs, respectivement pour les modes deep et shallow. Une valeur à zéro (0) dévalide la resoumission.
     632
     633Il est recommandé dévalider le deep resubmission car le WMS peut resoumettre unjob qu'il croit (à tort) aborted ou bien un job qui a échoué peut déjà avoir
     634effectué un certains nombre d'opérations incompatibles avec un deuxième lancement. Par contre il est recommandé d'utiliser shallow resubmission pour donner plus
     635de chance à votre job d'être soumis.
     636
     637Dans l'exemple ci-dessous, on devalide le deep resubmission et on limite les
     638tentatives de shallow resubmission à 3:
     639
     640RetryCount = 0;
     641ShallowRetryCount = 3;
     642
    572643=== Références utiles ===
    573644
    574 
    575 
     645Consulter les documents ci-dessous pour plus d'informations. Vous pourrez apprendre par exemple dans le 1er document
     646(comment gLite 3.1 User Guide) :
     647
     648- utiliser GridFTP pour le transfert des SandBox
     649- utiliser les DAG (direct acyclic graphs) : jobs dépendants
     650- utiliser les Parametric jobs : collection de josb identiques sauf pour un parametre d'exécution.
     651
     652gLite 3.1 User Guide:
     653https://edms.cern.ch/file/722398/1.2/gLite-3-UserGuide.html
     654
     655Submission and monitoring of jobs via WMProxy using the command line interface:
     656http://wiki.egee-see.org/index.php/SG_Running_Jobs_WMProxy_CLI
     657
     658Tutorial: Submitting jobs :
     659http://www-numi.fnal.gov/offline_software/srt_public_context/GridTools/docs/jobs_tutorial.html#submitting_jobs
     660                               
     661
     662