HPC-Job-Monitoring HPC-Login HPC-Projektanträge HPC-Projektverwaltung
von Montag, 4. Mai 2026 17:00 bis Mittwoch, 6. Mai 2026 12:00DDN und Bull werden eine Dateisystemprüfung unter /data/horse durchführen, um beschädigte Dateien zu identifizieren und zu reparieren. Zu diesem Zweck werden alle HPC-Cluster (einschließlich Login-Knoten, Data Movers und Data Ports) heruntergefahren. Während dieser Zeit ist kein Zugriff auf Daten in den HPC-Dateisystemen möglich:
Beginn der Ausfallzeit: 4. Mai 2026, 17:00 Uhr
Voraussichtliches Ende der Ausfallzeit: 6. Mai 2026, 12:00 Uhr
Um diese Ausfallzeit optimal zu nutzen, werden Bull, DDN und ZIH außerdem zusätzliche globale Wartungsarbeiten durchführen, wie z. B. Änderungen am Netzwerk und an den NFS-Dateisystemen sowie verschiedene Updates. Sollten die Arbeiten an /data/horse deutlich länger dauern als die anderen Wartungsaufgaben, werden die Cluster Capella, Alpha Centauri und Romeo neu gestartet. Diese Cluster verfügen über alternative Scratch-Dateisysteme (/data/cat und /data/quokka), sodass Jobs dort ausgeführt werden können. Allerdings können nur Jobs mit dem entsprechenden Flag für das erforderliche Dateisystem (-L cat oder -L quokka) gestartet werden [1]. (Tipp: Sie sollten die Flags für die erforderlichen Dateisysteme am besten schon heute in Ihre Skripte einbauen.)
[1] https://compendium.hpc.tu-dresden.de/data_lifecycle/working/#working-filesystems