aus scinexx
Der Wissenschaft droht ein Daten-Alzheimer
Forscher stellen alarmierenden Verlust an Rohdaten schon nach wenigen Jahren fest
Der Forschung droht ein schleichender Verlust ihrer Daten: Durch
schlampige Speicherung und veraltete Kontakt-Informationen bleiben schon
nach wenigen Jahren die Rohdaten vieler Studien unauffindbar. Nach 20
Jahren sind 80 Prozent der Rohdaten verloren, wie kanadische Forscher
jetzt herausfanden. Das aber ist fatal: Ohne Rohdaten lassen sich
Ergebnisse nicht nachvollziehen, Methoden und Schlussfolgerungen nicht
überprüfen und auch eine Weiterführung der Forschung ist oft kaum
möglich.
Jedes
Jahr werden hunderte von Studien und Experimenten durchgeführt,
Forscher sammeln dabei Unmengen von Rohdaten an. "Die meisten dieser
Daten sind einzigartig und unersetzlich, andere nur mit großem Aufwand
zu rekonstruieren", erklärt Timothy Vines von der University of British
Columbia in Vancouver. Doch bisher gibt es keine Regelung dazu, diese
Daten besonders zu schützen oder zentral aufzubewahren. Stattdessen
bleibt es jedem Wissenschaftler selbst überlassen, wo und wie er seine
Forschungsdaten speichert.
Wie gefährdet sind die Rohdaten?
Das aber birgt ein Risiko, dann unter Umständen ist ein Autor nicht mehr
erreichbar oder aber vergisst nach einer Weile, alte Daten weiterhin zu
speichern. Das könnte bedeuten, dass wertvolle Rohdaten verloren gehen
und so Studienergebnisse nach einiger Zeit nicht mehr reproduzierbar
sind. Wie groß die Gefahr für solche Datenverluste ist, haben Vine und
seine Kollegen nun überprüft.
Für ihre Studie suchten sie nach Studien, die zwischen 1991 und 2011
morphologische Untersuchungen an Tieren und Pflanzen mit Hilfe einer
bestimmten Form der Analyse durchgeführt hatten. In dem
20-Jahres-Zeitraum waren dies 516 Veröffentlichungen. Nun versuchten die
Wissenschaftler, an die Rohdaten dieser Studien heranzukommen. Sie
suchten die E-Mail-Adressen der Autoren heraus und kontaktierten diese.
Ungültige Kontaktdaten und schlampige Speicherung
Dabei zeigte sich bereits die erste Hürde: Je älter die
Veröffentlichungen waren, desto wahrscheinlicher war es, dass die im
Paper angegebene E-Mail-Adressen nicht mehr gültig waren und dass sich
auch durch Suche im Internet keine Ersatz-Kontaktmöglichkeit fand. Um
rund sieben Prozent sank die Wahrscheinlichkeit pro Jahr, wie die
Forscher berichten.
Und noch ein Problem zeigte sich: Von den Forschern, die erfolgreich
kontaktiert werden konnten, hatten viele selbst die Rohdaten nicht mehr -
weil das Speichermedium veraltet war, der Rechner nicht mehr existierte
oder sie nicht ausreichend gesichert wurden. Während bei zwei Jahre
alten Studien noch alle Datensätze erhalten waren, sank die Chance mit
jedem Jahr Abstand um rund 17 Prozent. Bei den ältesten Studien warten
80 Prozent der Daten unauffindbar. "Keiner erwartet, dass es leicht
ist, Rohdaten für eine 50 Jahre alte Studie zu finden. Aber es war schon
überraschend festzustellen, dass schon nach 20 Jahren fast alle
Rohdaten verloren gegangen waren", so Vine.
Zentrale Datenbanken als Lösung
Dieses Ergebnis bestätige, dass Forschungsdaten nicht verlässlich über
lange Zeit gesichert werden können, wenn sie beim einzelnen Forscher
bleiben. "Das aktuelle System bedeutet, dass die meisten Daten im Laufe
der Zeit verloren gehen - und damit keine Möglichkeit mehr besteht, die
ursprünglichen Ergebnisse nachzuvollziehen oder aber diese Daten für
neue Studien auszuwerten", konstatiert Vine.
Er und seine Kollegen appellieren daher an die wissenschaftlichen
Fachjournale, ihre Praxis zu ändern und Rohdaten der Forscher, die bei
ihnen veröffentlichen in einer zentralen, öffentlich zugänglichen
Datenbank zu lagern. Einige Fachmagazine wie das renommierte British
Medical Journal (BMJ) praktizieren dies bereits. Das hat auch einen
weiteren Vorteil: Fälschungen oder Schöngefärbte Ergebnisse lassen sich
so ebenfalls leichter entlarven, da dann andere Forscher die Daten
überprüfen können. "Der Verlust wissenschaftlicher Daten ist eine
Verschwendung von Forschungsgeldern und begrenzt zudem eine effektive
Forschung", sagt Vine. Konzertiertes Handeln sei daher dringend nötig,
um dies zu ändern und die Daten auch für die Zukunft zu sichern.
(Current Biology, 2013; doi: 10.1016/j.cub.2013.11.014)
(University of British Columbia, 03.01.2014 - NPO)
Keine Kommentare:
Kommentar veröffentlichen