You are here

Von Fischen bis zu Kleinalgen – kontinuierlicher Datenfluss von der Diversity Workbench zu GBIF

SNSB-IT-Center-Logo

Seit 15 Jahren entwickelt das Datenzentrum an den Staatlichen Naturwissenschaftlichen Sammlungen Bayerns, München (SNSB) als koordinierende Einrichtung das Datenmanagementsystem Diversity Workbench (DWB). Diese erfolgt zusammen mit Partnern an der Universität Bayreuth und der Biologischen Bundesanstalt Berlin (letztere Institution bis 2013, nunmehr abgelöst durch das Museum für Naturkunde Berlin). Seit 2010 tragen auch das Staatliche Museum für Naturkunde Karlsruhe und das Zoologische Forschungsmuseum Alexander Koenig maßgeblich zur technischen Weiterentwicklung des Systems bei. Gefördert durch das BMBF im eben abgeschlossenen Projekt „GBIF-D“ hat die Einrichtung in München in den vergangenen drei Jahren einen Standard-Datenfluss, ausgehend von DWB-Datenbanken und deren Peripherieanwendungen, über Cache-Speicher bis hin zum Datenportal GBIF etabliert.

SNSB Datenfluss

Beispiel für einen kontinuierlichen Datenfluss vom Anwender bis zu nationalen und internationalen Datenportalen im Web (z.B. GBIF). Graphik: SNSB IT-Zentrum

Die Installationen ermöglichen eine Langzeit-Datenpflege in einem zugleich flexiblen wie auch komplexen System aus relationalen Datenbanken, deren Einträge über Rich Client-Applikationen gepflegt werden. Bereits zu Beginn des Daten-Lebenszyklus werden sowohl umfangreiche Qualitätskontrollen durchgeführt als auch den z. T. rudimentären Originaldaten zusätzliche relevante Metadaten hinzugefügt. Vom Dateneigentümer bzw. Datenkurator angestoßen, können die einzelnen Datensätze und Multimedia-Daten ganz oder in Teilen via Export freigegeben und im gewünschten technischen Format für GBIF und weitere Portale bereitgestellt werden. Die auf Langfristigkeit ausgelegte technische wie fachwissenschaftliche Betreuung sowohl des Datenmanagementsystems als auch der Daten-Pipelines führte dazu, dass das Vertrauen in die etablierten Lösung wuchs und damit eine größere Anzahl unterschiedlichster Datenquellen für sämtliche Organismengruppen erschlossen werden konnten. Insgesamt werden derzeit am SNSB IT-Zentrum 37 Datenquellen mit über 700.000 Datensätzen verwaltet, von welchen sogar Daten zu historischen Sammlungsobjekten in ihrer Mehrzahl georeferenziert wurden.

Geographische Verteilung

Geographische Verteilung der 560.000 georeferenzierten Daten des Datenpublishers SNSB. Bild: www.gbif.org/publisher/0674aea0-a7e1-11d8-9534-b8a03c50a862

Für die Anwender bestehen verschiedene Möglichkeiten, die DWB zu nutzen. Folgendes Flussdiagramm zeigt vier Alternativen von Installationen, angefangen von einer individuellen Lösung für Einzelpersonen bis zu umfangreichen Client-Server-Lösungen, geeignet für Datenzentren an größeren wissenschaftlichen Einrichtungen. Das SNSB IT-Zentrum berät und unterstützt potentielle Anwender.

DWB-Umgebungen

Die vier Alternativen zur Installation von Diversity Workbench Umgebungen (genaue Beschreibung unter diversityworkbench.net/Portal/DWB_environments_alternatives). Graphik: SNSB IT-Zentrum

Seit Mai verfügbar sind die folgenden vier Datenbestände mit einer Vielzahl von Bildern zu den einzelnen Objekten:

Fossile Fische von der Bayerischen Staatssammlung für Paläontologie und Geologie (GBIF)

Fossile Fische vom Jura-Museum Eichstätt (GBIF)

Fischskelette der Staatssammlung für Anthropologie und Paläoanatomie München (GBIF)

Blütenpflanzen aus dem Herbar der Regensburgischen Botanischen Gesellschaft (GBIF)

Der nächste Workshop mit allgemeiner Einführung in die DWB findet am 2. Dezember 2014 in München statt. Um verbindliche Anmeldung wird gebeten.

 

(Autorin: Tanja Weibulat, SNSB IT-Zentrum, München)

AnnoSys als Annotationssystem in GBIF integriert

Virtuelles Herbarium Deutschland jetzt online

Das Virtuelle Herbarium Deutschland (http://vh.gbif.de), abgekürzt VH/de, ist ein neues Internet-Portal, das den freien Zugang zu umfangreichen Pflanzensammlungen aus deutschen Herbarien ermöglicht.

BioCASe Provider kann sich nun mit Excel-Dokumenten verbinden

Über den Biological Collection Access Service (BioCASe) werden Millionen Biodiversitätsdaten aus Deutschland an Biodiversitätsnetzwerke geliefert. Neuigkeiten gibt es aus der BioCASe-Entwicklung

Von Fischen bis zu Kleinalgen – kontinuierlicher Datenfluss von der Diversity Workbench zu GBIF

Seit 15 Jahren entwickelt das Datenzentrum am SNSB

 

Deutsche Datenbereitstellung für GBIF: immer auf dem aktuellsten Stand

Biodiversitätsdaten, die aus Deutschland an GBIF geliefert werden

Subscribe to GBIF-Deutschland News