← Zurück zu TU Dresden Betriebsstatus

Wartung/Downtime: HPC, 04.05.26, 17 Uhr - 06.05.26, 12 Uhr

Montag, 04 Mai 2026 17:00:00

HPC-Job-Monitoring HPC-Login HPC-Projektanträge HPC-Projektverwaltung

von Montag, 4. Mai 2026 17:00 bis Mittwoch, 6. Mai 2026 12:00

DDN und Bull werden eine Dateisystemprüfung unter /data/horse durchführen, um beschädigte Dateien zu identifizieren und zu reparieren. Zu diesem Zweck werden alle HPC-Cluster (einschließlich Login-Knoten, Data Movers und Data Ports) heruntergefahren. Während dieser Zeit ist kein Zugriff auf Daten in den HPC-Dateisystemen möglich:

Beginn der Ausfallzeit: 4. Mai 2026, 17:00 Uhr 
Voraussichtliches Ende der Ausfallzeit: 6. Mai 2026, 12:00 Uhr

Um diese Ausfallzeit optimal zu nutzen, werden Bull, DDN und ZIH außerdem zusätzliche globale Wartungsarbeiten durchführen, wie z. B. Änderungen am Netzwerk und an den NFS-Dateisystemen sowie verschiedene Updates. Sollten die Arbeiten an /data/horse deutlich länger dauern als die anderen Wartungsaufgaben, werden die Cluster Capella, Alpha Centauri und Romeo neu gestartet. Diese Cluster verfügen über alternative Scratch-Dateisysteme (/data/cat und /data/quokka), sodass Jobs dort ausgeführt werden können. Allerdings können nur Jobs mit dem entsprechenden Flag für das erforderliche Dateisystem (-L cat oder -L quokka) gestartet werden [1]. (Tipp: Sie sollten die Flags für die erforderlichen Dateisysteme am besten schon heute in Ihre Skripte einbauen.)

[1] https://compendium.hpc.tu-dresden.de/data_lifecycle/working/#working-filesystems