High Performance Computing
High Performance Computing Cluster
Das Rechenzentrum betreibt einen High Performance Computing Cluster (HPC-Cluster). Dieser besteht aus
- 52 Compute Knoten
- 7 Compute Knoten mit Infiniband
- 5 GPU Knoten
- 5 FAT Knoten
- 5 um GPUs erweiterbare Knoten
Daneben steht ein Speichersystem mit 500TB zur Verfügung.
Das HPC-System wird primär im Batch-Modus über ein Queuing-System (SLURM) betrieben. Des weiteren können virtuelle Maschinen über einen Private-Cloud-Ansatz zur Verfügung gestellt werden.
Für Rechenjobs stehen, je nach Anforderung, unterschiedliche Laufzeiten zur Verfügung.
Rechenzeit beantragen
Zur Beantragung von Rechenzeit ist ein Formular auszufüllen.
Supportanfragen und Ansprechpartner
Supportanfragen können per E-Mail an julia-support@uni-wuerzburg.de gestellt werden.
Ansprechpartner im Bereich HPC sind Dr. Christoph Brüning und Aleksander Paravac.
HPC Job System
Als Queuing-System kommt SLURM zum Einsatz.
Benutzung
Mit seinem JMU-Account kann man sich über SSH auf julia.uni-wuerzburg.de einloggen und dort Job-Skripte starten.
Zum Transfer von Daten steht per RSYNC/SSH die Maschine julia-storage.uni-wuerzburg.de zur Verfügung.
Eine kurze Einführung in OpenStack kann hier herunter geladen werden
Eine generelle Dokumentation und Beispiele findet man unter http://doku.hpc.uni-wuerzburg.de/ (Erreichbar aus dem Uni-Netzwerk oder von extern via VPN).
Queues und Laufzeiten
Es stehen folgende Queues zur Verfügung:
- Generic Compute
- GPU
- Infiniband
Für Rechenjobs stehen Laufzeiten von 6h, 48h und einer Woche zur Verfügung. Es empfiehlt sich daher Rechenjobs mit Resume Funktion zu implementieren. Ist dies nicht möglich bzw. sollten eine längere Laufzeit benötigt werden, so kann eine Support-Anfrage gestellt werden.
Gruppen, Projekte, Accounts
Benutzergruppen sind organisatorische Einheiten wie z.B. Mitglieder von Lehrstühlen.
Neue Benutzergruppe beantragen
Mitglieder von Benutzergruppen können dann Projekten wie z.B. Arbeitsgruppen zugeordnet werden.
Benutzeraccounts können dann passend zu einem Projekt freigeschaltet werden.