1. tous les nœuds sont désormais connectés sur un switch Infiniband (100Gb/s)
  2. les nœuds hors service orval 1,2,3 7 et 8 ont été retirés de la base données de calculco
  3.  6 nouveaux ont été ajoutés

  • 3 HPE DL360 avec processeurs Intel: orval 20,21,23. Il sont rigoureusement identiques à orval18 et orval19, soit 5 noeuds identique avec chacun: 2x28=56 cœurs et 512 Go de RAM
  • 2 HPE DL365 avec processeurs AMD EPYC, "Milan" (2x 48=96 coeurs, 512 Go RAM): orval 27 et 28
  • 1 XE8545 (AMD EPYC) doté de 4 carte GPU nvidia "Ampere" (A100 40GB), reliées par de liens rapide (NV Link) pour un usage multi-GPU.

Tous ces noeuds sont destinés à être accessibles en mode default, y compris le quadri-GPU. Cependant, aussi bien l'usage de ce dernier que son intégration dans les gestionnaire de ressource OAR entraînera probablement quelques actions correctives : j'ai provisoirement défini un projet "PCS" et seuls les utilisateurs de projet peuvent passer des jobs en mode "Default" (prioritaire) mais tout le monde peut passer en "besteffort"

oarsub -l /gpu=x (avec x=1 ou 2 ou 3 ou 4!)