Eine naturwissenschaftliche Forschungsgruppe will die Herstellung und Untersuchung von Proben so dokumentieren, dass Fragestellungen, Methoden und Ergebnisse nachvollziehbar und nachnutzbar bleiben. Die Analysen der erhobenen Daten werden von einer Vielzahl an Forschenden durchgeführt, darunter auch solchen mit Programmierkenntnissen.
Häufig wechselnde Fragestellungen und veränderte Protokolle sowie eine hohe Fluktuation der Forschenden prägen den Forschungsalltag. Die Durchführung der Laborarbeiten ist kostspielig und zeitaufwändig, daher sollen für spätere Analysen möglichst viele Alt-Daten mit einbezogen werden. Erhobene Daten müssen für mindestens 10 Jahre archiviert werden und sollen für die Weitergabe an andere Forschungsgruppen oder Veröffentlichungen strukturiert zusammenfassbar sein.
Anforderungen: Flexibilität und Datenstrukturierung
Dieses Szenario beschreibt Anforderungen, die dabei helfen, Datenmanagement FAIR (Findable, Accessible, Interoperable, Reusable) zu gestalten:
- Verknüpfung von Proben mit SOPs (Standardarbeitsanweisungen), Ausgangsmaterialien, (elektronischen) Laborbüchern und Geräteeinstellungen und Ergebnissen, außerdem mit vorangegangenen und aus Forschungen hervorgehenden wissenschaftlichen Publikationen.
- Flexibilität, wenn SOPs, Versuchsdurchführung, Versuchsaufbau oder verwendete Geräte sich ändern: Es muss weiterhin möglich sein, die gleichen Suchanfragen auf unterschiedlich durchgeführten Versuchen durchzuführen, um Ergebnisse zu vergleichen oder gemeinsam auszuwerten.
- Der Zugriff auf die Daten und ihre Verknüpfungen und die Suche danach muss sowohl einstiegsfreundlich und gleichzeitig mächtig sein, es muss aber auch programmatischer Zugang über APIs (Programmierschnittstellen) möglich sein.
- Der Export von einzelnen Datensätzen oder größeren Gruppierungen von Daten muss einfach ermöglicht werden und in standardisierten Datenformaten für Austausch und Archivierung erfolgen.
Umsetzung mit LinkAhead
LinkAhead verknüpft standardmäßig Datensätze unterschiedlichster Art miteinander und macht diese Verknüpfungen genauso der Suche zugänglich wie die verwalteten Daten selbst. Damit ist der komplette Lifecycle von Publikationen, darauf aufbauenden Hypothesen, Versuchen, Auswertungen und erneuten Publikationen einfach darzustellen. Die Suche wie auch der Zugriff auf Datensätze ist entweder direkt in der Weboberfläche von LinkAhead möglich oder über eine API, für die bereits Clientbibliotheken (auf GitLab, z.B. für Python) frei existieren.
Für LinkAhead sind flexible Datenmodelle Teil der DNA, damit sind spätere Anpassungen einfach möglich, auch wenn neue Arten von Daten hinzu kommen oder die Art der Verknüpfung sich grundlegend verändert. Suchanfragen liefern dann sowohl „alte“ als auch „neue“ Datensätze zurück. Der Datenbestand von LinkAhead oder Teile davon können standardisiert zum Beispiel als XML exportiert werden und so unabhängig weitergegeben oder archiviert werden.