You are here

Projekte des Knotens Bakterien und Archaeen GBIF-Deutschland

 

Datenmobilisierung


Der Focus des Knotens GBIF-D Bakterien und Archaeen ist es, organismenbezogene prokaryontische Daten durch innovative Methoden der Datenmobilisierung zu erschließen. Der Umfang und die Dichte der verfügbaren Taxon-bezogenen Information soll dadurch wesentlich erhöht werden. Diese erweiterte Datenbasis wird völlig neuartige Biodiversitätsanalysen (Verbreitungsmuster, Vergleich Omics-basierter mit physiologischen Daten, Verbreitung von Abbaureaktionen oder Naturstoffsynthesen) ermöglichen.

 


 

Für Bakterien und Archaeen sind spezifische Informationen zu Habitaten und Biogeographie, Biochemie und Physiologie, sowie ausführliche Beschreibungen der Kultivierungsbedingungen in Verbindung mit den jeweiligen Resultaten aus Genom- und Metagenomanalysen bislang nur unzureichend digital verfügbar.
Sofern dazu relevante Informationen in schriftlicher Form vorhanden sind, wie z.B. Erstbeschreibungen oder jahrelang gewissenhaft protokollierte Beschreibungen von Lebendsammlungen, sind diese Wissensquellen zumeist weder zentral lokalisiert noch strukturiert durchsuchbar oder über das Internet abrufbar.


Mobilisierung von Schrift und Bildmaterial


In einem ersten Schritt wird das  Material gesichtet und digitalisiert. Dabei stellt die Digitalisierung nur den ersten Schritt der Verarbeitung dar. Die nun digitalisierten Informationen werden durch Text und Data Mining Methoden in eine strukturierte und auswertbare Form überführt. Dabei wendet man Methoden des Text und Data Mining an. Diese umfassen unterschiedliche Analyseverfahren mit denen unstrukturierte Texte, Tabellen oder Zahlenwerte in eine strukturierte und durchsuchbare Form, also Datenbankinhalt überführt werden. Die Algorithmen, die hier Anwendung finden haben ihren Ursprung sowohl in dem Bereich der Sprach- und Computerlinguistik als auch der Statistik und des maschinellen Lernens. Die verarbeiteten Daten und Bilder werden den jeweiligen Taxa zugeordnet, inhaltlich und semantisch strukturiert, aufbereitet und schließlich öffentlich zur Verfügung gestellt werden.



 

 

[31.01.2012]

AnnoSys als Annotationssystem in GBIF integriert

Virtuelles Herbarium Deutschland jetzt online

Das Virtuelle Herbarium Deutschland (http://vh.gbif.de), abgekürzt VH/de, ist ein neues Internet-Portal, das den freien Zugang zu umfangreichen Pflanzensammlungen aus deutschen Herbarien ermöglicht.

BioCASe Provider kann sich nun mit Excel-Dokumenten verbinden

Über den Biological Collection Access Service (BioCASe) werden Millionen Biodiversitätsdaten aus Deutschland an Biodiversitätsnetzwerke geliefert. Neuigkeiten gibt es aus der BioCASe-Entwicklung

Von Fischen bis zu Kleinalgen – kontinuierlicher Datenfluss von der Diversity Workbench zu GBIF

Seit 15 Jahren entwickelt das Datenzentrum am SNSB

 

Deutsche Datenbereitstellung für GBIF: immer auf dem aktuellsten Stand

Biodiversitätsdaten, die aus Deutschland an GBIF geliefert werden

Subscribe to GBIF-Deutschland News