Intern
Rechenzentrum

Archivierung von Daten

Bei der Sicherung von Daten unterscheidet man zwischen Backup und Archivierung.

Backup ist eine automatisierte Sicherung aller relevanten Daten eines Servers in regelmäßigen Abständen. Er dient vor allem zum Schutz gegen Hardwareausfälle, kann aber ggfls. auch genutzt werden, um versehentlich gelöschte oder geänderte Dateien wieder herzustellen. Normalerweise werden nur die aktuellen Dateien sowie kürzlich geänderte oder gelöschte Dateien aufbewahrt; auf dem Server nicht mehr vorhandene Daten werden nach einiger Zeit auch im Backup gelöscht.

Archivierung ist dagegen eine vom Benutzer angestoßene Sicherung ausgewählter Daten für einen bestimmten Zeitraum. Typischerweise werden diese Daten im täglichen Betrieb nicht mehr benötigt und können daher nach der Archivierung auf dem Quellsystem gelöscht werden. Ein Zugriff ist nur selten notwendig und nicht zeitkritisch. Beispiele sind Messdaten, Versuchsreihen, hochauflösende Digitalisierungen usw.

Nach den Empfehlungen der DFG zur Sicherung guter wissenschaftlicher Praxis sollen Primärdaten von Forschungsprojekten für zehn Jahre aufbewahrt werden.

Für die Strukturierung der Daten ist der Benutzer verantwortlich. Es empfiehlt sich, mehrere zusammengehörige kleine Dateien zusammenzufassen und mit "sprechenden" Namen zu versehen, um ein späteres Wiederauffinden zu erleichtern. Außerdem ist darauf zu achten, dass die Dateiformate auch nach Jahren noch interpretierbar sein müssen, so dass man weit verbreitete, nicht spezialisierte Formate verwenden sollte.

Für die Archivierung von Daten (derzeit bis zu zehn Jahren) betreibt das Rechenzentrum den Archivserver.