Das Problem
Bei der Arbeit mit Computersystemen landen die Ergebnisse üblicherweise in Dateisystemen: Hier werden die Resultate vieler Stunden Arbeit von Mensch und Maschinen abgelegt und dauerhaft gespeichert. Über die Jahre sammeln sich so schnell große Datenmengen an, und schon nach kurzer Zeit sind die Entstehung und die semantischen, also Bedeutung tragenden, Zusammenhänge der Datensätze nicht mehr rekonstruierbar. Diese Tendenz ist insbesondere dann gegeben, wenn die mit diesen Daten arbeitenden Menschen fluktuieren. Sie kennen es sicher: Die Auffindbarkeit und Durchsuchbarkeit von Datensätzen in Ihren Dateisystemen kann schnell langwierig, kompliziert oder sogar erfolglos sein, wenn keine spezielle Datenmanagementsoftware eingesetzt wurde. Ein modernes Datenmanagement muss komplexe Zusammenhänge zwischen unterschiedlichen aber zusammenzudenkenden Datenstücken erkennen, und genau diese Semantik durchsuchbar machen. Das Datenmanagementsystem funktioniert wie eine Suchmaschine in Ihrem Dateisystem.
Einfache Dateisuche – mächtige Ergebnisse
Dabei ist eine einfache aber mächtige Suchsprache in besagter „Suchmaschine“, die den Bedürfnissen aller Anwender:innen entspricht, von enormer Bedeutung. Abfragen (Queries) nach einfachen Suchbegriffen müssen gleichermaßen durchführbar sein, wie auch verschachtelte, komplexe Suchanfragen, die nur auf einen speziellen Teil des Datensatzes zielen. Eine Suchmaschine im Dateisystem spart Ihnen jede Menge Zeit bei der Suche und zeigt Ihnen genau die Entstehungs- und Versionsgeschichte Ihrer Datensätze. Auch die Suche nach Dateien in begrenzten Zeiträumen, oder unter ausschließlicher Beteiligung von einer oder mehreren Personen, Inputs, Maschinen oder Geräten oder aber auch eine Kombination aus alledem ist mit einem Datenmanagementsystem möglich.
Ein gut durchsuchbares Dateisystem spart Zeit und Geld – jetzt und später
Unsere Dateien im Dateisystem sind die Ergebnisse vergangener Arbeit – und damit sehr wertvoll. Das Unbrauchbarwerden oder die Unbenutzbarkeit dieser Ergebnisse ist ein teures Unterfangen. Die Kosten, die zur Erstellung der Daten angefallen sind, können Sie sicherlich anhand des Inputs an Arbeit grob überschlagen. Auch die Unfähigkeit zur Reproduzierbarkeit von Suchergebnissen in kritischen Momenten kann teuer zu stehen kommen – und schlimmstenfalls zur kostspieligen oder sogar unmöglichen Wiederholung von aufwändigen Experimenten, Vertragsstrafen, usw. führen. Große Mengen Zeit, Wissen und Geld können so durch Nachlässigkeit verloren gehen. Die Lösung hierfür ist ein Datenmanagement, das über Jahre (oder eines Tages Jahrzehnte) Dateien und Daten sammelt, so dass deren Inhalte einfach zur Weiterverarbeitung und für weitere Forschung zur Verfügung stehen. So multipliziert sich der Wert bereits getaner Arbeit: Folgearbeit wird erleichtert und Ergebnisse werden wiederverwendet – um so schneller zu Forschungsergebnissen für drängende aktuelle Forschungsfragen zu kommen.
Routiniertes Datenmanagement für beste Ergebnisse
Natürlich ist eine sinnvolle und tiefe Durchsuchbarkeit Ihres Dateisystems per Suchmaschine keine „plug and play“-Angelegenheit. Vielmehr müssen die bestehenden Dateistrukturen analysiert und verstanden werden, damit Ihre Anbindung an eine Dateisystem-Suchmaschine wie unsere Datenmanagementsoftware LinkAhead möglich wird. Das Programm muss lernen, wie Dateien abgelegt sind, um aus diesem Wissen die semantischen Zusammenhänge in einer (bei Ihnen in-house installierten) LinkAhead-Instanz abzubilden. Das geschieht natürlich nachdem das System erst einmal aufgesetzt ist größtenteils automatisiert – und ist damit in der Wartung pflegeleicht.
So bleiben Daten langfristig und zuverlässig durchsuchbar, und sparen Ihrer Abteilung Arbeit – ein echter Standortvorteil!
Weitere Infos
Wollen Sie mehr darüber erfahren, wie Sie Ihre Dateien einfach durchsuchbar machen?
- CaosDB ist die technische Grundlage für das Datenmanagementsystem LinkAhead, und genauso Open-Source-Software.
- Mitarbeitende von IndiScale haben einen wissenschaftlichen Artikel veröffentlicht, der beschreibt, wie LinkAhead für Forschungsdatenmanagement eingesetzt werden kann. Und das ganz ohne Programmierkenntnisse vorauszusetzen.
- Viele Tools sind auf forschungsdaten.info verlinkt.
- Schauen Sie sich auf Youtube bei unseren Schulungen um.