Ein neues in Deutschland ansässiges Projekt will Biodiversitätsdaten retten, die verloren gehen könnten, weil sie nicht in institutionelle Datenbanken integriert, in ver alteten digitalen Speichersystemen aufbewahrt oder nicht ordnungsgemäß dokumentiert sind.
Das Projekt des Botanischen Gartens und Botanischen Museums Berlin-Dahlem ist ein gutes Beispiel für eine GBIF-Empfehlung zur Einrichtung von Hosting-Zentren für Biodiversitätsdaten. Dies ist eine von mehreren Empfehlungen zum Datenmanagement, die gerade von GBIF veröffentlicht wurden.
Das Team hinter dem deutschen Projekt namens reBiND, oder Biodiversity Needs Data, hat damit begonnen, bedrohte Datenbanken für die Archivierung zu identifizieren und wird sie über das GBIF-Netzwerk zugänglich machen.
Der Fokus liegt zunächst auf Objekt- und Beobachtungsdaten, die bereits digitalisiert sind, aber nicht Teil des Dokumentationsprozesses eines Museums oder einer anderen Institution sind. Beispiele sind Daten von Diplom- oder Doktorarbeiten, die in der Regel auf einer Computerfestplatte oder einem Datenträger gespeichert sind und aufgrund fehlender Dokumentation oft Gefahr laufen, verloren zu gehen.
Beispiele für Daten, die vom reBiND-Projekt "gerettet" werden, sind:
- Eine private Sammlung von Beobachtungsdaten zu Käfern aus Streuobstwiesen in Süddeutschland. Die Daten wurden vom Biologen Andreas Kohlbecker auf einem Mac 512-Computer von 1986 unter Verwendung eines Mac OS 6.8-Betriebssystems und unter Verwendung der Filemaker II-Software von 1989 gespeichert. Die Daten wurden gerettet, indem das Betriebssystem und die Software im Basilisk II Mac Emulator ausgeführt wurden.
- Umfangreiche Primärdaten aus einer Doktorarbeit über epiphytische Moosvegetation auf den Kanarischen Inseln. Sie waren 1997 mit Excel-Dateien auf ver alteten 3,5-Zoll-Disketten gespeichert worden. Sie wurden mit einem externen Diskettenlaufwerk lesbar gemacht und werden in das XML-Format konvertiert. Diese Daten sind besonders wertvoll, da die Studie erstmals Moosgemeinschaften auf den Inseln unter Berücksichtigung des Mikroklimas und menschlicher Einflüsse dokumentierte.
Der vom reBiND-Projekt entwickelte Workflow verwendet das Softwarepaket des Anbieters Biological Collections Access Services (BioCASe), um Daten in XML-Dateien umzuwandeln. BioCase ist eines der Veröffentlichungstools, über das Daten im GBIF-Netzwerk veröffentlicht werden. Reparatursoftware erkennt und korrigiert alle Fehler, die während des Konvertierungsprozesses eingeführt wurden. ReBiND zielt darauf ab, Benutzer mit einem Minimum an technischem Hintergrundwissen in die Lage zu versetzen, ihre Biodiversitätsdaten zu transformieren und zu archivieren.
Derzeit liegen die XML-Dateien mit den geretteten Daten auf dem projekteigenen Server in einer eigens dafür eingerichteten Datenbank. Die Daten sollen über das GBIF-Netzwerk weltweit auffindbar und zugänglich gemacht werden, und das Team arbeitet mit GBIF Deutschland zusammen, um dies zu erreichen.
Das Projekt geht davon aus, weltweit Datenrettungsarbeiten zu übernehmen. Das Team arbeitet außerdem an einem Best-Practice-Handbuch zur Rettung und Speicherung bedrohter digitaler Daten.
Das dreijährige Projekt wird von der Deutschen Forschungsgemeinschaft gefördert.
Das GBIF-Positionspapier zur Datenhosting-Infrastruktur für primäre Biodiversitätsdaten befasst sich mit der Rettung und erneuten Bereitstellung von Daten, die in schwer zugänglichen Formaten gespeichert sind. Es betont, dass die Biodiversitätsgemeinschaft Standards annehmen und Werkzeuge entwickeln muss, um die Datenermittlung zu ermöglichen und somit zur Datenerh altung beizutragen.