FAQ zur Richtlinie zum Umgang mit Forschungsdaten an der LUH

Eine leuchtende Glühbirne Eine leuchtende Glühbirne Eine leuchtende Glühbirne © Sergei Akulich | Pixabay

Richtlinie zum Umgang mit Forschungsdaten

Forschungsdaten haben eine große Bedeutung im wissenschaftlichen Erkenntnisprozess. Wesentliche Prinzipien für einen professionellen Umgang mit diesen Daten sind daher vielfach in Policies auf verschiedenen Ebenen festgelegt, von einzelnen Verbundprojekten bis zu internationalen Forschungsorganisationen. An der LUH sind Grundsätze zu den Anforderungen und Verantwortlichkeiten beim Datenmanagement auf institutioneller Ebene in der "Richtlinie zum Umgang mit Forschungsdaten an de LUH" formuliert. Auf dieser Seite haben wir dazu ergänzende Erklärungen und Informationen zusammengestellt.

Datenbeschreibung und -dokumentation

  • Was sind Forschungsdaten?

    Forschungsdaten sind Daten, die im Verlauf eines wissenschaftlichen Arbeitsprozesses erzeugt und verarbeitet werden. Sie bilden die Grundlage von Forschungsergebnissen. Dabei kann es sich um sehr unterschiedliche Arten von Daten handeln, z.B. um Messergebnisse, Sekundäranalysen, Visualisierungen, Modelle oder die Resultate von Umfragen und Erhebungen. Ebenso vielfältig sind die möglichen Datei-Formate, um Zahlen, Text, Programmcode oder Grafiken zu speichern. Mitunter werden sogar physische Proben wie Mineralien oder Gewebe als "Daten" definiert.

  • Welche Dateiformate sind mit den FAIR-Prinzipien vereinbar?

    Das Management von Daten beginnt bereits mit ihrer Erhebung. Daten werden mit vielfältigen Methoden gesammelt und erzeugt, z.B. durch Messungen, Simulationen, Umfragen oder Textanalysen. Sie liegen als Tabellen, CAD-Daten, Bild- und Rasterdaten, Transkripte, Programmcodes und vieles mehr vor und können in unterschiedlichen Dateiformaten gespeichert werden. Von der gewählten Methodik, der Art der Daten und ihren Dateiformaten hängt ab, ob und wie sie automatisch weiterverarbeitet werden können, wie kompatibel sie mit anderen Hard- und Softwaresystemen sind (Interoperable) und ob sie langfristig lesbar bleiben (Re-usable).

    Die Art Ihrer Daten bestimmt ihre Form. So lassen sich beispielsweise Umfragedaten besser tabellarisch als in Form eines Textes strukturiert ablegen. Komplexe Datenerhebungen dürften besser in einer Datenbank aufgehoben sein als in einem Excel-Sheet.

    Wichtig ist die Wahl des Dateiformats. Einige Geräte und viele Anwendungsprogramme speichern Daten in einem Hersteller-spezifischen Format, das mit anderer Software selten lesbar ist. Prüfen Sie die Möglichkeit, die Daten in ein offenes Format zu exportieren oder zu konvertieren, um die Interoperabilität zu erhöhen.

    Empfehlungen zu Dateiformaten finden Sie unter anderem auf der Homepage der Landesinitiative Langzeitverfügbarkeit des Landes Nordrhein-Westfalen.

  • Wie sieht eine gute Dateibenennung und Ordnerstruktur aus?

    Ordner- und Dateinamen sollten aus Elementen bestehen, die eine schnelle Einordnung des Inhalts erlauben. Sie können beispielsweise Auskunft über das Erstellungsdatum, die Dateiversion und die bearbeitende Person geben. Diese Elemente sollten ein einheitliches Format haben und in gleichbleibender Reihenfolge verkettet werden. Achten Sie darauf, dass Benennungskonventionen im Vorfeld vereinbart, schriftlich fixiert und während des Forschungsprozesses eingehalten werden.

    Je mehr Informationen Dateinamen enthalten desto länger können sie werden. Da einige Programme sehr lange Dateinamen nicht verarbeiten können, bietet es sich an, die Teile der Information, die für alle Dateien in einem Ordner gleich sind, stattdessen im Ordnernamen abzubilden.

    Tipps für die Dateibenennung

    • Datumsangaben im Format JJMMTT, also z.B. 150828 für den 28. August 2015
    • Personenangaben verkürzen, z.B. auf Initialen
    • Nutzen Sie nur folgende Zeichen für Dateinamen: A-Z a-z 0-9 _ (Unterstrich)
    • Verwenden Sie keine Umlaute, Leerzeichen oder Sonderzeichen, denn viele Programme erkennen diese Zeichen nicht als Teil des Dateinamens oder stellen sie nicht korrekt dar
  • Was ist mit Dokumentation von Daten gemeint? Was sind Metadaten?
    • Strukturierte Informationen zur Dokumentation und Beschreibung von Forschungsdaten gehören zu den sogenannten sogenannte Metadaten. Dazu gehören zum Beispiel Angaben zum Kontext und zu technische Eigenschaften. Forschungsdaten sollten immer zusammen mit ihren Metadaten abgelegt werden. In einem öffentlichen Repositorium geschieht dies i.d.R. automatisch und verpflichtend. Im Projektverlauf können Metadaten auf unterschiedliche Weise gesammelt werden, z.B.
    • in einer Datenbank
    • in Tabellen (z.B. Excel)
    • in Readme-Dateien (Text, PDF)
    • in einer strukturierten XML-Datei
    • integriert in den Daten-Dateien (z.B. im Fileheader)

    Durch eine gute und strukturierte Dokumentation, inklusive der Erfassung von Metadaten, werden die Daten...

    • besser auffindbar (auch maschinell, z. B. durch Suchmaschinen)
    • besser oder überhaupt erst nachnutzbar
    • zitierfähig und damit dem Ersteller der Daten zuordbar
    • wertvoller für die Wissenschaft, da Inhalte, Qualität und Bearbeitungsstand besser eingeschätzt werden können
       

    Grundlegende deskriptive Metadaten

    • Eindeutiger Identifier (z.B. ein DOI)
    • Titel
    • Ersteller:in (hauptverantwortlich Forschende)
    • Erhebungsdatum (auch Versionen)
    • Format (ggf. benötigte Software)
    • Fachgebiet
    • Beschreibung der Daten / Abstract
    • Erfassung der Daten (räumlich / zeitlich)
    • Organisation
    • Rechte / Lizenzbestimmungen
    • Beziehung zu anderen Objekten (Daten, Texte...)
       

    Weiterführende Links

    Informationen auf forschungsdaten.info zu Metadaten und Metadatenstandards

    Allgemeine Metadatenschemata:

  • Wie ist ein Datenmanagementplan strukturiert?

    Die Planungen zum Umgang mit Forschungsdaten sollten zu Beginn des Forschungsprozesses in einem Datenmanagementplan (DMP) festgehalten werden. Inhalt eines DMP ist:

    • Überblick über das Projekt
    • Welche Daten werden in meinem Projekt verwendet? (Selber generierte Daten, bereits existierende Daten)
    • Wie werden die Daten verwaltet? (Dateinamen, Speicherort (intern / extern), Backups)
    • Wie werden die Daten aufbereitet?
    • Welche rechtlichen Aspekte müssen beachtet werden? (Datenschutz, Lizenzen)
    • Datenaustausch und Publikation
    • Wer macht was mit den Daten während des Projekts (Dokumentation, Rollen und Verantwortlichkeiten)?
    • Welche Ressourcen stehen mir zur Verfügung? (Geld, Material, Personal, Zeit)

    Generell sollten Sie einen Datenmanagementplan für den projektinternen Gebrauch möglichst ausführlich formulieren. Passen Sie ihn entsprechend an, wenn der Forschungsprozess von der ursprünglichen Planung abweicht oder bestimmte Aspekte konkretisiert werden sollen.

    Online Tools für die Erstellung von DMP

    • DMPonline: freies, englischsprachiges Online-Tool für die Erstellung von Datenmanagementplänen des Digital Curation Centre (DCC)
    • RDMO: freies DMP-Tool für die institutionelle Nutzung mit eigenen Instanzen

    Weiterführende Informationen

  • Welche rechtlichen Aspekte sind zu beachten?

    Bevor Sie wissenschaftliche Daten erheben, verarbeiten und veröffentlichen, sollten Sie die rechtlichen Rahmenbedingungen und Vorgaben für den Umgang mit Forschungsdaten prüfen. Personenbezogene Daten unterliegen zum Beispiel den Datenschutzgesetzen. Dazu können Sie sich als Beschäftigte der LUH ausführlich durch die Stabsstelle Datenschutz beraten lassen. Wenn Sie Daten verarbeiten, die von anderen Personen oder Institutionen erhoben wurden, prüfen Sie im Vorfeld, ob und unter welchen Bedingungen deren Nutzung erlaubt ist. Wurden die Daten vielleicht unter speziellen Lizenzen veröffentlicht? Klären Sie außerdem mit Ihrem Arbeitgeber, welche Verwertungsrechte Sie an den von Ihnen erhobenen Daten haben. Wenn Sie gemeinsam mit anderen Daten erzeugen, treffen Sie am besten vorab gemeinsam schriftliche Vereinbarungen dazu, wer welche Daten in welcher Form nutzen darf. 

    Gesetze

     
    Weiterführende Links

Speichern, Archivieren und Publizieren

  • Wo können Daten sicher gespeichert werden?

    Der Verlust Ihrer unter Kosten-, Zeit- und Arbeitsaufwand erhobenen Daten und der darauf aufbauenden Analysen kann erhebliche negative Folgen für Ihre Forschung haben. Wer Forschungsdaten digital erzeugt und auswertet, muss gemäß der guten wissenschaftlichen Praxis sicherstellen, dass nichts verloren geht und die Ergebnisse sicher aufbewahrt werden. Folgende Grundsätze sollten Sie beachten:

    • Regelmäßige Datensicherung der zum Forschungsprojekt gehörenden Dateien auf geeignete Medien oder Nutzung von Backup-Diensten.

    • Die Sicherungsintervalle bestimmen die im Fehlerfall mögliche Verlustquote - je häufiger Sie speichern, desto geringer ist der mögliche Datenverlust.

    • Jedes Backup ist nur so gut, wie die Datenwiederherstellung: Testen Sie die Wiederherstellung auf ihren Computer, bevor ein Notfall eintritt.
       

    Backup & Restore am LUIS

    Nutzen Sie für die Datenablage nach Möglichkeit Institutsserver, deren Daten regelmäßig vom LUIS gesichert werden. Mit dem Dienst Backup & Restore erstellen Institute und zentrale Einrichtungen automatisch täglich Sicherungskopien von Serverdaten, die sich regelmäßig ändern oder die zu aktuellen Projekten gehören. Alternativ steht der "Sync & Share"-Dienst Seafile als Teil des zentralen Dateiservices bereit, der ebenfalls automatisch ausgewählte Daten auf einen LUIS-Server kopieren kann. Zusätzlich lassen sich diese Daten damit auch auf weitere Geräte verteilen.

    Backup-Programme

    Die Daten auf ihrem PC-Arbeitsplatz lassen sich auch mit den eingebauten Mechanismen Ihres Betriebssystems (ab Windows Vista etwa Backup&Restore) oder mit Spezial-Software auf externe Medien (USB-Speicher, DVD, Bänder) sichern. Eine Liste solcher Programme finden Sie bei Wikipedia.

    Weiterführende Links

  • Wie speichere ich zugriffsbeschränkte Daten?

    Überlegen Sie sorgfältig, wo und wie Sie Ihre Daten ablegen und sichern. Arbeiten Sie mit schutzwürdigen Daten, sollten Sie den Zugang sowie die Lese- und Schreibberechtigungen auf den unmittelbaren Kreis der Mitarbeitenden einschränken. Solche Beschränkungen lassen sich zum Beispiel über Gruppenrichtlinien auf Dateisystem-Ebene oder entsprechende Einstellmöglichkeiten von Dateidiensten wie dem vom LUIS angebotenen Seafile festlegen. Beim Umgang mit personenbezogenen Forschungsdaten, lassen Sie sich bitte auch von der Stabsstelle Datenschutz beraten, ob Ihre technischen und organisatorischen Sicherheitsmaßnahmen ausreichend sind.

    Kostenlose Cloud-Speicherdienste und unverschlüsselte USB-Medien sind kein geeigneter Platz für schützenswerte Daten. Personenbezogene Forschungsdaten müssen Sie aus Gründen des Datenschutzes grundsätzlich verschlüsselt speichern. Sie können ganze Dateisysteme von Massenspeichern wie Festplatten und tragbaren USB-Medien verschlüsseln, so dass Unbefugte sie nicht auslesen können (Datenträgerverschlüsselung). Die meisten Betriebssysteme wie macOS, Windows und Linux bringen dazu bereits Software mit (FileFault, Bitlocker, dm-crypt). Eine gute Alternative ist das quelloffene Programm VeraCrypt. Damit können Sie neben ganzen Laufwerken und Partitionen auch einzelne Ordner und Dateien direkt verschlüsseln. Letzteres funktioniert auch mit etlichen Archivmanagern (z.B. 7-Zip).

    Weitere Informationen

  • Wo können Daten entsprechend der FAIR-Prinzipien archiviert und publiziert werden?

    Die Archivierung und Publikation von Daten in einem speziellen Datenrepositorium ist eine Möglichkeit, um Daten langfristig verfügbar und zitierfähig zu machen. Die meisten Repositorien haben spezielle Anforderungen an die Daten, die bestenfalls bereits vor der Datenerstellung bedacht und berücksichtigt werden sollten. Üblicherweise sind das einige oder alle der folgenden Anforderungen:

    • Verwendung offener Datenformate, die die langfristige Archivierung und den Zugriff erleichtern
    • Pflicht-Metadaten zur Dokumentation, um Auffindbarkeit und Nutzbarkeit zu erhöhen
    • Versicherung, dass Archivierung und Zugriff auf die Daten nicht gegen das Urheberrecht oder den Datenschutz verstoßen.
    • Nutzung von Lizenzen oder Vereinbarungen, welche die Nachnutzung erleichtern (z.B. Open Access, Open Access nach einer Embargofrist)

    Worauf Sie bei der Wahl eines Repositoriums achten sollten

    • Garantierte Datenaufbewahrung für mindestens 10 Jahre

    • Bezahlbare Gebühren für die langfristige Datenaufbewahrung (Diese können auch in einem Projektantrag direkt mit beantragt werden.)

    • Erfassung von Metadaten zu jedem Datensatz, die mindestens den Standards DataCite oder Dublin Core entsprechen

    • Vergibt für jeden Datensatz eindeutige, langfristig gültige Identifier, wie z.B. einen DOI

    Repositorien

    re3data.org
    Index allgemeiner und fachspezifischer Repositorien

    RIsources
    Portal der DFG für Forschungsinfrastrukturen

    Leibniz Universität Hannover

    RADAR
    Generisches Daten-Repositorium betrieben vom FIZ Karlsruhe

    ZENODO
    Generisches Repositorium, finanziert von der Europäischen Union und betrieben am CERN

  • Welche Daten sollen publiziert werden?

    Viele Förderer, Universitäten und Wissenschaftsorganisationen empfehlen oder verlangen, Forschungsdaten frei zugänglich zu machen. Dadurch sind einerseits die publizierten Auswertungen besser überprüfbar. Andererseits wird eine Nachnutzung durch Dritte ermöglicht.

    In der Regel ist es jedoch weder möglich noch sinnvoll, sämtliche im Forschungsprozess entstandene Daten zu publizieren. Ein wichtiger Schritt ist daher die Auswahl der publikationswürdigen Daten, die der/die Forschende selbst trifft. Wir empfehlen die Publikation aller Daten, die mindestens eines der folgenden Kriterien erfüllen:

    • Einzigartigkeit: Es sind keine Dubletten der Daten bereits an anderer Stelle veröffentlicht.

    • Stark eingeschränkte Reproduzierbarkeit: Die Daten könnten nicht oder nur unter sehr großem Aufwand erneut generiert werden.

    • hohe fachliche Relevanz: Die Daten sind für Ihre Fachcommunity oder sogar fachübergreifend von besonderem Interesse.

    • Grundlage von Textpublikationen: Sie haben Bücher oder Artikel veröffentlicht, die auf der Auswertung dieser Daten basieren.

    Damit Ihre Daten auch tatsächlich nachgenutzt werden können, beachten Sie bitte Folgendes:

    • Adäquate Dokumentation: Stellen Sie ausreichend beschreibende Metadaten bereit, damit der Datensatz verständlich ist und gezielt in einer Datenbank (z.B. eines Repositoriums) gesucht werden kann.

    • Lesbarkeit: Speichern Sie die Daten nach Möglichkeit in offenen, weit verbreiteten Formaten, die plattformunabhängig geöffnet werden können und keine spezielle (evtl. nicht dauerhaft verfügbare) Hard- und Software benötigt.

    • Rechte: Prüfen Sie, ob ggf. Rechte Dritter einer Veröffentlichung entgegenstehen (z.B. Urheber-, Datenschutz- oder Persönlichkeitsrechte). Falls das der Fall ist, versuchen Sie, sich alle notwendigen Rechte von den Betroffenen schriftlich einräumen zu lassen. Versehen Sie Ihre Daten mit einer offenen Lizenz (z.B. CC0), damit sie uneingeschränkt nachgenutzt werden dürfen.

  • Welche Lizenzen werden empfohlen?

    Bevor Daten mit Dritten geteilt werden, sollten die Voraussetzungen für die Nachnutzung geklärt werden. Forschenden an der LUH wird empfohlen, offene Lizenzen für Datenpublikationen zu verwenden. Mit der Vergabe einer offenen Lizenz räumt der/die Urheber:in anderen Personen das Recht ein, die Daten uneingeschränkt zu verwenden, zu verändern und weiterzuverbreiten. Es gibt auch Lizenzen, die diese Rechte einschränken. Diese gelten dann aber nicht mehr als "offen". Die Vergabe einer standardisierten Lizenz ist in der Regel eine Voraussetzung für die Publikation in Repositorien.

    Lizenzen

Richtlinien und Projektplanung

  • Wie erstelle ich eine instituts- und/oder projektinterne Richtlinie?

    Das Service-Team Forschungsdaten hat zur Unterstützung bei der Erstellung einer internen Richtlinie zum Umgang mit Forschungsdaten eine Handreichung bereitgestellt. Diese gibt einen Überblick in die erforderlichen Schritte von den Vorüberlegungen bis zur Umsetzung und Evaluation einer Richtlinie. Sie enthält auch eine Übersicht von möglichen inhaltlichen Grundsätzen.

    Eine weitere, sehr ausführliche Anleitung der Technischen Universität Berlin für das Teilvorhaben „Forschungsdaten-Policies für Forschungsprojekte“ im DFG-Verbundprojekt „FDNext“ finden Sie hier.

    Ein Beispiel aus der LUH ist die Richtlinie zum Forschungsdatenmanagement des Sonderforschungsbereichs 1464 TerraQ.

    Das Service-Team Forschungsdaten begleitet Institute und Projekte bei der Erstellung einer Richtlinie zum Umgang mit Forschungsdaten in persönlichen Beratungsgesprächen.

  • Welche Kosten fallen für das Forschungsdatenmanagement an?

    In welchem Maße Kosten für Maßnahmen zum Forschungsdatenmanagement entstehen, ist in jedem Projekt unterschiedlich. Drei Beispielkalkulationen finden Sie hier. Wichtige Einflussfaktoren sind das anfallende Datenvolumen, die Anzahl der Dateien und der Grad ihrer Homogenität. Je mehr manuelle Arbeit erforderlich ist, desto höher ist der Personalaufwand und damit die Kosten. Die Datenpublikation ist in vielen Repositorien gratis möglich. Allerdings können bei größeren Datenvolumina oder der Inanspruchnahme zusätzlicher Dienstleistungen (z.B. Datenaufbereitung und -kuratierung) Kosten entstehen.

Einbindung von FDM-Themen in die Lehre