You are here

Verbesserung der Datenqualität von BioCASE-Datensätzen durch Annotationen

Annotationen sind ein wichtiges Instrument für die Verbesserung der Datenqualität. In der analogen Welt wurden und werden Herbarbögen von Experten schriftlich annotiert und diese Annotationslabel direkt auf den Beleg geklebt. Diesen Annotationsprozess auf digitalisierte, im Internet publizierte Belegdaten zu übertragen ist eine große biodiversitätsinformatische Herausforderung. Annotationen können z.B. die taxonomische Identität eines Beleges oder einer Beobachtung betreffen, den nomenklatorischen Typus, morphologische Merkmale oder die Georeferenzierung, aber auch auf Literatur oder weitere Probenahmen verweisen. Alle diese Annotationen erhöhen den wissenschaftlichen Wert der Daten und gewährleisten die Kommunikation neuer wissenschaftlicher Ergebnisse. Bei gegenwärtig über 383 Millionen Datensätzen, die digital über das GBIF-Netzwerk verfügbar sind, ist die Möglichkeit der Online-Annotation von hoher Relevanz.

Das AnnoSys-Projekt (https://annosys.bgbm.fu-berlin.de/) hat ein Annotationsdaten-Repositorium für komplexe und vernetzte Daten entwickelt, das Back-end Server Funktionalitäten, Web-Services und eine Nutzeroberfläche umfasst. AnnoSys ermöglicht es, solche Datensätze online zu annotieren und diese Annotationen über das Internet zugänglich zu machen. Hierdurch werden stattfindende Ergänzungen, z.B.  im Rahmen von Forschungsprojekten, und Verbesserungen der Datenqualität von Belegdaten dokumentiert, gesichert und nachhaltig verfügbar gemacht.

 AnnoSys-Homepage
 
Die AnnoSys-Implementierung erfolgte am Beispiel botanischer Sammlungs- und Observationsdaten, wie sie vom BioCASE-Netzwerk in großen Mengen über GBIF-D zur Verfügung stehen. Der AnnoSys-Workflow zur Erstellung und Suche von Annotationen wurde kürzlich in der Zeitschrift Taxon open access publiziert.

Das gegenwärtige AnnoSys ist auf ABCD-XML-Daten zugeschnitten, jedoch potentiell für XML-Daten generisch. Hierdurch eröffnet sich die Möglichkeit, AnnoSys interoperabel mit anderen Biodiversitätsnetzwerken und ihren spezifischen Standards auch domänenübergreifend einzusetzen.

Link zur Publikation

Link zur Projektseite

Link zu BioCASe

(Autorin: Okka Tschöpe, BGBM, Berlin)

Mehr als eine Milliarde Biodiversitätsdaten in GBIF

06/07/2018 - 13:30

Am 4. Juli 2018 durchbrach GBIF die Schallmauer von einer Milliarde Biodiversitätsdaten.

AnnoSys als Annotationssystem in GBIF integriert

Virtuelles Herbarium Deutschland jetzt online

Das Virtuelle Herbarium Deutschland (http://vh.gbif.de), abgekürzt VH/de, ist ein neues Internet-Portal, das den freien Zugang zu umfangreichen Pflanzensammlungen aus deutschen Herbarien ermöglicht.

BioCASe Provider kann sich nun mit Excel-Dokumenten verbinden

Über den Biological Collection Access Service (BioCASe) werden Millionen Biodiversitätsdaten aus Deutschland an Biodiversitätsnetzwerke geliefert. Neuigkeiten gibt es aus der BioCASe-Entwicklung

Von Fischen bis zu Kleinalgen – kontinuierlicher Datenfluss von der Diversity Workbench zu GBIF

Seit 15 Jahren entwickelt das Datenzentrum am SNSB

 

Subscribe to GBIF-Deutschland News