Gemeinsam forschen und Daten teilen - so funktioniert's!
Interview mit Maike Paul, Ph.D., zu ihren Erfahrungen mit einem gemeinsamen Datenmanagement in einem Verbundprojekt zur Küstenforschung
Zur Person
Dr. Maike Paul forscht am Ludwig-Franzius-Institut für Wasserbau, Ästuar- und Küsteningenieurwesen zu Maßnahmen zum Schutz von Küsten vor Erosion durch Wellen und Strömungen. Seit 2016 leitet sie das Verbundprojekt SeaArt, in dem ein künstliches Seegras entwickelt wird, das wiederum die Ansiedlung natürlichen Seegrases fördert. Für dieses Projekt hat sie frühzeitig einen Datenmanagementplan entwickelt und umgesetzt.
Zur Person
Dr. Maike Paul forscht am Ludwig-Franzius-Institut für Wasserbau, Ästuar- und Küsteningenieurwesen zu Maßnahmen zum Schutz von Küsten vor Erosion durch Wellen und Strömungen. Seit 2016 leitet sie das Verbundprojekt SeaArt, in dem ein künstliches Seegras entwickelt wird, das wiederum die Ansiedlung natürlichen Seegrases fördert. Für dieses Projekt hat sie frühzeitig einen Datenmanagementplan entwickelt und umgesetzt.
Service Team Forschungsdaten: Frau Paul, wenn Sie an die Anfänge Ihrer wissenschaftlichen Karriere zurückdenken: Wann und warum wurde das Thema Forschungsdatenmanagement für Sie erstmals besonders relevant?
Maike Paul: Relevant war es wahrscheinlich von Anfang an, auch schon während meiner Doktorarbeit, aber bewusst wurde es mir erst sehr viel später. Ich habe meine Doktorarbeit von 2007 bis 2011 am National Oceanography Centre an der Universität Southampton geschrieben, und dort war Forschungsdatenmanagement überhaupt kein Thema. Jeder hat mit seinen Daten das gemacht, was er für richtig hielt. Das Thema Datenmanagement - auch unter diesem Begriff - kam für mich Anfang 2015 auf, als ich in Hannover am Forschungszentrum Küste angefangen und einen Antrag selber geschrieben habe. Da wurde es vom Mittelgeber gefordert, einen Datenmanagementplan mit einzureichen. Als ich mich dann mit dem Thema beschäftigt habe, ist mir klar geworden, dass am Forschungszentrum Küste eine Strategie zum Datenmanagement vorliegt. Das wurde nur nie so genannt. Am Forschungszentrum Küste wird strukturiert mit Daten umgegangen. Es gibt dazu eine Systematik, die auch allen Mitarbeitenden beigebracht wird, wenn sie dort anfangen. Diese Begrifflichkeiten kamen aber erst mit der Antragsstellung, als ich mich dann mal damit beschäftigt habe, was da eigentlich alles zugehört.
Service Team Forschungsdaten: Sie arbeiten in dem Projekt "SeaART" zur Küstenforschung zusammen mit der Hochschule Hannover, der TU Braunschweig, einem Partner aus der Privatwirtschaft und dem Niederländischen Institut für Meeresforschung (NIOZ). Welchen Herausforderungen begegnen Sie beim gemeinsamen Umgang mit Daten? Und welche Erfahrungen haben Sie dabei mit einem Datenmanagementplan gemacht?
Maike Paul: Die Herausforderung ist, dass es bei den unterschiedlichen Partnern jeweils eigene Datenmanagementstrategien gibt. Diese sind manchmal sehr explizit formuliert und manchmal nur sehr rudimentär oder den Mitarbeitenden nicht unbedingt bekannt. Aber letzten Endes gibt es überall Datenmanagementstrategien. Diese so weit zu vereinheitlichen, dass man im Projekt auf eine gemeinsame Basis kommt, und alle Daten im Projekt so verwaltet und dokumentiert werden, dass alle Partner aus allen Partnerinstitutionen auch etwas mit ihnen anfangen können, das sehe ich als ganz große Herausforderung. Genauso wie die Sensibilisierung gerade der Nachwuchsmitarbeitenden in den Projekten dafür, warum es wichtig ist, eine Dokumentation zu machen. Denn das Datenmanagement wird von ihnen oft nicht als notwendig erachtet oder als Zeitverschwendung angesehen.
Service Team Forschungsdaten: Sie haben dann einen Datenmanagementplan entworfen, der die Vorgehensweisen der beteiligten Partner vereinheitlicht und dann für alle verbindlich ist?
Maike Paul: Genau. Es gibt einen Datenmanagementplan, der ist am Anfang des Projektes mit allen Projektbeteiligten zusammen entwickelt worden, so dass es allen Partnern möglich ist, nach wie vor in ihrem eigenen Datenmanagementsystem unterwegs zu sein, es aber so anzupassen, dass es für das Projekt einheitlich oder zumindest für andere Projektpartner verständlich ist. Der Plan ist projektverbindlich vereinbart.
In dem Zusammenhang ist auch eine Datenaustauschplattform entstanden, damit Daten nicht per E-Mail oder USB-Sticks transportiert werden müssen. Hier sind wir an die Grenzen der Speicherkapazitäten der Austauschplattform gestoßen, weil wir eine Zeitlang auch sehr große Bilddaten hatten. Im Gelände sind viele Fotos und Videos entstanden, die durchaus auch qualitative Messinformationen beinhalten. Um den gemeinsamen Speicherplatz zu entlasten, haben wir uns dann irgendwann dagegen entschieden, sie auf der gemeinsamen Plattform abzulegen. Stattdessen liegt jetzt ein Metafile auf dem Server, in dem beschrieben steht, welche Daten es gibt und bei welchem Partner sie liegen.
Am Anfang habe ich als Projektkoordinatorin die Einhaltung des Datenmanagementplans stichprobenartig kontrolliert, habe also wirklich auf dem Server nachgeschaut, ob Metadaten mit abgelegt und Benennungskonventionen eingehalten wurden. Inzwischen erinnere ich nur noch bei jedem Projekttreffen an den Datenmanagementplan, um meine Leute dahin zu bringen, dass er in ihre tägliche Routine übergeht. Und ich stelle zur Diskussion, ob er in seiner jetzigen Form noch aktuell ist und noch funktioniert, oder ob sich aufgrund der Erfahrung im Projekt etwas ergeben hat, wo wir gesagt haben: „Diesen einen Absatz im Datenmanagementplan, den haben wir am Anfang für total sinnvoll erachtet, ist aber aus der Erfahrung heraus nicht praktikabel“ oder „Wir machen etwas mit unseren Daten, was wir jetzt total wichtig finden, was aber gar nicht im Datenmanagementplan abgebildet ist.“ Es ist also durchaus ein lebendes Dokument. So lerne ich auch selber für das nächste Projekt, was sinnvoll ist, worauf beim Datenmanagement geachtet werden muss.
Service Team Forschungsdaten: Sie forschen am Ludwig-Franzius-Institut hier an der Leibniz Universität, einem Partner-Institut des Forschungszentrums Küste. Gibt es für die gemeinsame Forschung Grundsätze für den Umgang mit Daten? Und welche unterstützende technische Infrastruktur nutzen Sie?
Maike Paul: Am Institut gibt es keine niedergeschriebenen Richtlinien, aber es gibt ein strukturiertes Ablagesystem für Dateien auf dem Server und Vorlagen. Zum Beispiel gibt es eine Vorlage, wie das Ablagesystem innerhalb von Projekten aussehen soll. Ich fände es sinnvoll - gerade nach der Erfahrung, die ich eben mit den Nachwuchswissenschaftlern in SeaArt gemacht habe - wenn es an zentraler Stelle, eine schriftliche Anleitung zum Datenmanagement gäbe. Wir haben ein institutsinternes Wiki in dem man eine Nachschlageseite anlegen könnte, um einfach wiederholt für diese Thematik zu sensibilisieren. Ich denke, gerade Leuten, die frisch von der Uni kommen, ist noch überhaupt nicht klar, wie wichtig es ist, Daten so abzulegen und zu dokumentieren, dass man sie in drei Jahren immer noch verstehen kann.
Service Team Forschungsdaten: Was würden Sie heute Promovierenden und Postdocs aus Ihrem Forschungsbereich zum Umgang mit Daten raten?
Maike Paul: Dokumentieren, dokumentieren, dokumentieren! Ich kann es nicht anders sagen, es ist mir selber passiert: Das ist etwas, da rechnet man noch gar nicht mit, wenn man mit einer Doktorarbeit oder frisch im Wissenschaftsbetrieb anfängt. Aber es ist mir jetzt durchaus passiert, dass mich Leute von anderen Einrichtungen gefragt haben: „Kann ich mal die Rohdaten zu dem 2011er Paper haben? Ich würde meine Messergebnisse gerne damit vergleichen.“ - „Ja, sehr gerne… Ich guck dann mal, wo die Daten aus 2011 sind… und wie die Excel-Datei heißt, in der ich das alles abgelegt habe...“ Bisher habe ich alles wieder gefunden, und konnte es auch so weitergeben, dass jemand anderes es benutzen konnte. Aber ich merke eben immer mehr, wie hilfreich es ist, so etwas von vornherein zu dokumentieren, damit man es später schneller findet. Der Zeitaufwand, den ich 2019 habe, um Daten aus dem Jahr 2011 auszugraben, ist sehr viel geringer, wenn ich die Daten 2011 gut dokumentiert habe.