Erklärt! Backup
Forschungsdaten sind die wertvolle Basis von Forschungsergebnissen. Aus diesem Grund sollte die Sicherung neben der Erhebung, Verarbeitung, Analyse und Veröffentlichung Ihrer Forschungsdaten immer ein zentrales Anliegen sein. Der Verlust von Daten kann tage-, wochen-, monate- bis hin zu jahrelange Forschungsarbeit zunichte machen. Insbesondere bei Daten, die sich nicht reproduzieren lassen, ist ein Verlust gravierend. Diese Problematik haben wissenschaftspolitische Akteure wie auch Forschungsförderinstitutionen erkannt. Der langfristige Erhalt der Forschungsergebnissen zugrundeliegenden Daten stellt sowohl die Forschenden, als auch die Forschungseinrichtungen vor neue Herausforderungen, die es gemeinsam zu bewältigen gilt. Deutsche Forschungsinstitutionen und Förderorganisationen betonen die Wichtigkeit der Datensicherung in ihren veröffentlichten Leitlinien und Grundsätzen zum Forschungsdatenmanagement. Einen Überblick über zentrale Leitlinien finden Sie bei uns unter Richt- und Leitlinien der Forschungsförderer. Am Göttingen Campus bauen die Infrastrukturdienstleister (neue) Speicher und Archivierungsangebote auf Grundlage der vorhandenen Regelungen auf.
Datenverlust kann jeden treffen
- Persönliche Speichermedien können beschädigt werden, verloren gehen, gestohlen oder zerstört werden. Datenverlust kann mitunter auch bei institutionellen Speichermedien auftreten, z.B. durch versehentliche Löschung.
- Wenn Wissenschaftlerinnen oder Wissenschaftler Projekte oder Institutionen verlassen oder die Projektlaufzeit endet, sind Daten und andere Forschungsergebnisse eventuell nicht mehr zugänglich oder verständlich gespeichert.
- Einige Daten sind nicht oder nur sehr aufwendig zu reproduzieren (z.B. Beobachtungen in Meteorologie, Astrophysik, Geowissenschaften oder Sozialwissenschaften).
- Veraltete Speichermedien können u. U. von zukünftigen Softwareumgebungen nicht interpretiert werden, gespeicherte Daten und Dateien werden dadurch unbrauchbar.
Die Hauptursache für einen Datenverlust sind Hardware-Ausfälle, aber auch menschliche Fehler können einen Verlust der Daten während oder nach dem Forschungsprozess auslösen. Um diese und andere mögliche Ursachen, wie Software-Fehler, Viren oder Hackerangriffe, Stromausfälle oder Naturkatastrophen, zu minimieren, sind gute Datensicherungs- und Managementstrategien notwendig (vgl. u.a. http://www.zdnet.com/article/how-data-gets-lost/ und http://researchdata.library.ubc.ca/files/2015/10/RDM_DataGuide_V03.1_20151020.pdf).
Speicherkonzept
Zwei Aspekte des Erhalts von Forschungsdaten sind die regelmäßige Anfertigung von Sicherungskopien der Originaldateien und deren Archivierung. Machen Sie sich bereits während der Planungsphase Ihres Forschungsprojektes Gedanken über die Aufbewahrung Ihrer Daten – z.B.
- durch die Erstellung eines Datenmanagementplans,
- die Klärung der Frage, welche Metadaten notwendig sind, um Ihre Daten angemessen zu dokumentieren und zu erklären,
- die Entscheidung, wie lange Ihre Daten gesichert werden sollten,
- die Klärung des Umgangs mit Copyright-Fragen, dem Datenschutz oder sensiblen (z.B. personenbezogenen) Daten.
Datenformate
Wenn Sie entscheiden, wie Ihre Daten gesichert werden sollen, verwenden Sie – wenn möglich – ein Format, dass:
- nicht firmeneigen, sondern offen und dessen Standards dokumentiert sind
- in Ihrer Fachdisziplin üblicherweise verwendet wird
- zur Zeichenverschlüsselung Standards verwendet
- nicht komprimiert ist
Beachten Sie, dass proprietäre, firmeneigene Dateiformate wie bspw. .doc oder .xls teilweise zur Langzeitarchivierung von Daten nicht ideal sind. Sichern Sie eine Version zusätzlich in einem offenen Format für die Archivierung (Quelle: http://researchdata.library.ubc.ca/files/2015/10/RDM_DataGuide_V03.1_20151020.pdf). Das britische Datenarchiv hat eine Tabelle mit empfohlenen Dateiformaten für verschiedene Datentypen veröffentlicht. Finden Sie zusätzlich einen sicheren Platz für Ihre Datenspeicher: Es gibt zahlreiche disziplinspezifische Repositorien und Datenbanken, die die Archivierung von Forschungsdaten anbieten. Viele können auf www.re3data.org gefunden werden.
Informationen im Web
Einige hilfreiche (englischsprachige) Webseiten zu Datenspeicherung und -sicherung haben wir für Sie zusammengestellt.
- Datenmanagement und -analyse bei der Johns Hopkins Universitätsbibliothek (US)
- Datenmanagement gute Praxis bei der University of Oregon (US)
- Backup und Speicherung bei Research Data Oxford (UK)
- Datenspeicherung bei ANDS (AUS)
Ein kurzes Überblicksvideo zur 3-2-1-Methode der Datensicherung gibt es außerdem auf dem YouTube-Kanal der Universität Göttingen:
https://www.youtube.com/watch?v=vsM8OM7D-OQ&list=PLgoiCMgV-zrfLp3DkVorGGU_MGXR5lsfY&index=18
Literaturhinweise zum Ein- & Nachlesen
- Neuroth, Heike, Stefan Strathmann, Achim Oßwald, Regine Scheffel, Jens Klump, und Ludwig, Hrsg. 2012. Langzeitarchivierung von Forschungsdaten – Eine Bestandsaufnahme. Boizenburg: Verlag Werner Hülsbusch.
- Schofield, Paul N., Tania Bubela, Thomas Weaver, Lili Portilla, Stephen D. Brown, John M. Hancock, David Einhorn, Glauco Tocchini-Valentini, Martin Hrabe de Angelis, und Nadia Rosenthal. 2009. „Post-Publication Sharing of Data and Tools“. Nature 461 (7261): 171–73. doi:10.1038/461171a.