Managementpläne für Forschungsdaten
(RDM – Research Data management)

Kurz gesagt, ist ein RDM-Plan ein strategisches Dokument, das den Umgang mit Daten während des gesamten Lebenszyklus beschreibt und Maßnahmen während und nach Ihrem Forschungsprojekt umfasst. Es ist ein sehr nützliches Werkzeug zur Ermittlung und Dokumentation von Maßnahmen sowie zur Unterstützung der gesamten Projektplanung. Als Grundlage für die Wiederverwendbarkeit von Daten kann der Plan darüber hinaus viele Probleme der Datenverwaltung verhindern oder helfen, mit anderen umzugehen. Es gibt nicht nur eine Art und Weise, wie man einen RDM-Plan erstellt, sondern ein weites Feld von Möglichkeiten. Es hängt stark von Forschungsfeld, Komplexität und Größe des Projekts ab. Aber typischerweise werden Forscher gebeten, zu berichten:


On this site:

Datenbeschreibung

Charakterisieren Sie die Daten, mit denen Sie arbeiten. Kategorisieren Sie die Quelle (observativ, experimentell, simuliert, abgeleitet, kompiliert), Form (Text, numerisch, audiovisuell, Modelle, Computercode), Format, Datenstabilität (fest, ständig wachsend, revisionssicher) und das erwartete Datenvolumen (Dateigröße, Datenmenge). Im Hinblick auf die Zugänglichkeit und Wiederverwendbarkeit ist es sinnvoll, sehr gängige und offene Datenformate zu berücksichtigen oder sicherzustellen, dass es möglich ist, sie in einem besser nutzbaren Format zu archivieren. Weitere Informationen finden Sie in der Library of Congress: Nachhaltigkeit digitaler Formate

Datenorganisation

Gerade bei der Arbeit im Team ist es wichtig, sich auf bestimmte Arten von Ordnungsprinzipien zu einigen und diese zu dokumentieren. Das bedeutet, dass man sich auf Konventionen für Dateien einigen muss (z.B. Benennung, Versionierung, Verzeichnisstruktur). Hier sind einige allgemeine Hinweise zur Vergabe von Dateinamen:

  • Verwenden Sie beschreibende Namen, die angeben, was die Datei/Ordner enthält
  • Verwenden Sie kurze Namen (weniger als 50 Zeichen)
  • Verwenden Sie einfache Namen, die leicht zu verstehen sind
  • Verwenden Sie alphanumerische Zeichen
  • Verwenden Sie Unterstriche (_) oder Bindestriche (-) anstelle von Leerzeichen
  • Vermeiden Sie Sonderzeichen wie: \ ‘= /,<>^:;()#*?%,”@!+{}~`[]
  • Vermeiden Sie die Verwendung interner Projektcodes oder Akronyme, die Personen außerhalb Ihres Labors oder Ihrer Forschungsgruppe nicht verstehen würden
  • Einbeziehung der zeitlichen oder räumlichen Informationen, falls zutreffend

Metadaten und Dokumentation

Metadaten – Daten über die Daten helfen bei der Suche, dem Verständnis, der Analyse und der Wiederverwendung von Daten. Metadaten sind das strukturierte Element der Dokumentation mit festen formalen Kriterien und nur den wichtigsten Kontextinformationen, was sie auch maschinenlesbar macht. Im Allgemeinen beschreibt die Datendokumentation das Wer, Wie, Was, Wo, Wann und Warum des Datensatzes. Die Datendokumentation variiert je nach Datenbeschaffenheit in Länge und Struktur und erfolgt oft nicht in einem standardisierten Format, sondern als Freitext. Das Verfahren ist von Forschungsgebiet zu Forschungsgebiet unterschiedlich (z.B. Laborjournal in der experimentellen Forschung, Beschreibung der Datenverarbeitung in der computergestützten Forschung). Es sollte leicht zu lesen und zu verstehen sein (klare, kurze, vertraute Wörter), um die Rückverfolgbarkeit und Reproduzierbarkeit zu ermöglichen. Einige exemplarische Themen, die angesprochen werden müssen, sind:

  • Der wissenschaftliche Grund für die Datensammlung
  • Welche Datenparameter wurden erhoben, einschließlich Einheiten und Formate
  • Welche Instrumente/Plattformen wurden zur Erhebung bzw. Generierung der Daten eingesetzt
  • Eine Liste der Datendateien, aus denen der Datensatz besteht
  • Im Datensatz verwendete Codes und Definitionen, was jeder Code bedeutet
  • Wann und wie oft die Daten erhoben wurden
  • Wie jeder Parameter gemessen oder erzeugt wurde (Methoden)
  • Für jeden Parameter die Maßeinheiten und das Format
  • Für jeden Parameter die Genauigkeit und Richtigkeit (falls bekannt)
  • Durchgeführte Datenverarbeitung
  • Gegebenenfalls verwendete Normen oder Kalibrierungen
  • Software, die zum Öffnen und Bearbeiten der Daten verwendet wurde
  • Qualitätssicherungs- und Qualitätskontrollmethoden
  • Datum, an dem der Datensatz zuletzt geändert wurde
  • Bekannte Probleme, die die Datennutzung einschränken

Ethik und geistiges Eigentum

Im Hinblick auf Forschungsdaten könnten folgende Rechte von Bedeutung sein:

Privatsphäre/Datenschutz: gilt, wenn während der Recherche personenbezogene Daten erhoben werden (insbesondere zutreffend für die Life Sciences). Für die Speicherung und Weiterverwendung ist eine Einwilligungserklärung erforderlich und die Daten müssen anonymisiert werden, um die Offenlegung von Personen zu vermeiden.

Urheberrecht: Primäre Forschungsdaten (besonders Messdaten) selbst sind in vielen Fällen nicht urheberrechtlich geschützt, sondern gehören der Allgemeinheit. Sobald sie in einer bestimmten Reihenfolge gesammelt oder verarbeitet werden, sind sie geschützt (z.B. Datenbankrecht). Wenn Sie urheberrechtlich geschützte externe Daten verwenden, haben Sie die Möglichkeit, die Nutzungsrechte vom Urheberrechtsinhaber durch eine transaktionale Übertragung zu erhalten.

Es wird empfohlen, die Eigentumsrechte und Rechte an Forschungsdaten vor Projektbeginn zu klären. Wenn Sie planen, Ihre Daten weiterzugeben, geben Sie klare Hinweise, was Wiederverwendende damit anfangen können. Eine Möglichkeit, die Nutzungsbedingungen zu präzisieren, ist die Lizenzierung Ihrer Daten. Die traditionellen Methoden sind Data-Sharing-Vereinbarungen oder Kooperationen. Eine weitere Möglichkeit besteht darin, offene Lizenzen zu verwenden und Rechte an Dritte zu vergeben.

Im Hinblick auf die gemeinsame Nutzung und Wiederverwendung von Daten ist CC0 Public Domain Widmung die empfohlene Lizenz. Für Erklärungen und weitere Informationen siehe den DCC-Leitfaden How to License Research Data.

Datenzugriff und -freigabe

Beim Datenzugriff während des Projekts müssen Sie sich über Datensicherheit, Authentifizierung, Zugriffsrechte und Datensynchronisation im Klaren sein.

Der Datenaustausch ist vor allem nach dem Projekt ein Thema. Bei der Vorbereitung Ihrer Daten für den Austausch von Dingen wie Formaten sind Dokumentation, Eigentum und Vertraulichkeit die wichtigsten Faktoren, an die Sie denken sollten. Für den Datenaustausch gibt es verschiedene Möglichkeiten. Die gebräuchlichsten sind das Teilen per E-Mail oder physischem Gerät nach einer individuellen Anfrage, die Online-Stellung auf einer persönlichen Webseite, das Hinzufügen als ergänzendes Material zur Veröffentlichung auf der Plattform des Journals, die Ablage in einem offenen Repository und die Veröffentlichung eines Datenpapiers.

Eine Reihe von Förderorganisationen (EC, FWF) und Wissenschaftsverlagen (Nature Publishing Group, BMC, PLOS) verlangen den Datenaustausch der veröffentlichten Forschung über ein offenes Repository. Dennoch gibt es Gründe, den Zugriff auf bestimmte Daten oder Teile davon (z.B. sensible Daten, urheberrechtlich geschützte Daten) einzuschränken. Legen Sie ein starkes Argument für Beschränkungen der gemeinsamen Nutzung vor, wie z.B. Embargozeiten oder eingeschränkten Zugang, und stellen Sie sicher, dass diese ordnungsgemäß begründet sind.

Am IST Austria haben Sie die Möglichkeit, Ihre Daten im institutionellen Datenspeicher IST Austria Research Explorer zu hinterlegen. Den Datensätzen wird ein DOI zugeordnet, der öffentlich zugänglich und langfristig gespeichert ist. In Ihrem RDM-Plan können Sie die folgende Phrase einfügen, um Ihre Absichten bezüglich Speicherung und Weitergabe zu artikulieren:
Am Institute of Science and Technology Austria wird ein institutionelles und öffentlich zugängliches Datenrepository (IST Austria Research Explorer: research-explorer.app.ist.ac.at) für die Veröffentlichung und den Austausch von Daten bereitgestellt. Darüber hinaus werden die hinterlegten Daten bei DataCite registriert und erhalten somit einen DOI, der die Zitierung der Daten ermöglicht.
(Name des Projekts/Forschers/etc.) verpflichten sich, die Daten innerhalb des vereinbarten Zeitraums im IST Austria Research Explorer für Daten, die zur Weitergabe geeignet sind, zu speichern.

Wenn Sie ein geeignetes Fachrepository finden, empfehlen wir Ihnen, eher dieses und nicht das institutionelle Repository zu nutzen, da Fachrepositorien sehr spezielle Dienste für fachspezifische Anforderungen anbieten können.

Hier sind einige Beispiele für Probleme, mit denen Sie sich befassen könnten:

  • Risiken für die Datensicherheit und Strategien zu deren Vermeidung
  • Umgang mit sensiblen Daten
  • Risiko der illegalen Beschaffung und Manipulation von Daten
  • Sichere Übertragung von Felddaten in den Hauptspeicher
  • Zugriffsrechte von Projektmitgliedern und MitarbeiterInnen
  • Passwortschutz für den Datenzugriff
  • Die Anforderungen der Forschungsförderer an den Zugang zu Daten
  • Repository und dessen Anforderungen an die Datenablage

Speicherung und Langzeitarchivierung

Wie man während des Projekts Daten speichert und sichert, ist eine wesentliche Frage. Unter Berücksichtigung der bereits vorhandenen Ressourcen ist es wichtig, weitere Maßnahmen zu bewerten und gegebenenfalls zu beschließen.

Nach der Projektabwicklung kann es aus verschiedenen Gründen (Österreichisches Datenschutzgesetz DSG, Anforderung des Forschungsförderers, langfristiger Wert der Daten) erforderlich sein, die Daten aufzubewahren. Die Aufbereitung der Daten nach den erwarteten Standards für die Archivierung ist ein zeitaufwendiger Prozess, für den Sie erhebliche Ressourcen bereitstellen sollten. Daten, die der Veröffentlichung zugrunde liegen, sollten extrahiert, in maschinenlesbarer Form erfasst und in einem Repository abgelegt werden, damit sie zugänglich bleiben. Stellen Sie sicher, dass Sie über alle Repository-Richtlinien informiert sind, die sich auf Ihre Daten auswirken könnten (z.B. akzeptierte Daten, bevorzugte Formate, Normalisierungsprozesse).

Wiederkehrende Themen in Bezug auf Speicherung und Langzeitarchivierung können sein:

  • Verfügbarkeit von Speicherplatz
  • Entgelte für Zusatzleistungen
  • Datensicherungsstrategie
  • Verantwortlichkeiten für Backup und Wiederherstellung
  • Datenwiederherstellung bei Datenverlust oder -beschädigung
  • Standort zur langfristigen Archivierung von Daten
  • Verfügbarkeit von fachspezifischen Repositorien
  • Zeitspanne der Datenspeicherung

Nachfolgend finden Sie eine Sammlung von Links zu Materialien, die Sie bei der Erstellung eines RDM-Plans unterstützen:

Allgemeine Hinweise
Data Management General Guidance (DCC)

Guidelines on FAIR Data Management in Horizon 2020

Guidelines on Open Access in Horizon 2020 to Publications and Data for IST Austria affiliates
Framework for creating a data management plan

Checklisten
Checklist for RDM planning

Elements of a RDM plan

Beispiele für einen RDM-Plan
Horizon 2020
Biology and Chemistry

Vorlagen für RDM-Pläne
DMP Online Tool
E-infrastructures Austria: Template for Data Management Plan



Nach Oben