Home
Über uns
Mitglieder
Arbeitsgruppen
Projekte
Produkte
Publikationen
Stellungnahmen
News
Interviews und Namensbeiträge
Newsletter
Presse
Termine
Stellenmarkt
Online-Services
 

 

"Es ist wichtig, dass man in Forscherteams einheitliche Datenformate und eindeutige Datenbeschreibungen verwendet"

Interview mit Frank Dickmann über die Schwierigkeiten, biomedizinische Forschungsdaten über lange Zeiträume zu archivieren und ein neues Projekt, das Lösungsansätze erarbeiten soll.

Juni 2011. "Wissenschaftler müssen wissen, wie sie an die archivierten Daten wieder herankommen. Da sie häufig in Forschungsverbünden, interdisziplinär und an verteilten Standorten arbeiten, reicht ein einfacher FTP-Server als Speicherort für Forschungsdaten nicht aus. Neben einem abgesicherten Datenzugriff ist es außerdem wichtig, dass man in Forscherteams einheitliche Datenformate und eindeutige Datenbeschreibungen verwendet."

Am 9. Juni 2011 fand unter Leitung von Frank Dickmann bei der TMF in Berlin der Kickoff-Workshop zu dem von der DFG geförderten Projekt "Langzeitarchivierung biomedizinischer Forschungsdaten" statt, an dem auch die TMF beteiligt ist. Das Interview zu diesem Thema führte Beate Achilles im Juni 2011.

 

Warum ist Langzeitarchivierung aktuell ein wichtiges Thema?

In der Forschung werden immer mehr digitale Daten erzeugt, die auch nach Zeiträumen jenseits von 30 Jahren  noch einfach, verlässlich und schnell zugänglich sein müssen. In der medizinischen Forschung sind das neben Messwerten auch Quelldaten wie Laborberichte, Krankenakten, Identifizierungs- und Pseudonymisierungslisten etc. Digitale Medien unterliegen einem schnelleren Lebenszyklus als analoge „Speichermedien“, wie man sie in früheren Zeiten hatte. Was vor hunderten von Jahren auf Lumpenpapier geschrieben wurde, ist heute noch oftmals gut erhalten und lesbar.

Denken Sie beispielsweise an die Gutenberg-Bibel. Wenn Sie diese mit einer Datei vergleichen, die lediglich auf einer Diskette gespeichert ist, wird das Problem der digitalen Archivierung deutlich: Kaum ein Rechner hat heute noch ein Diskettenlaufwerk, um diese Datenträger zu lesen. Mit anderen elektronischen Datenträgern verhält es sich ähnlich. Wenn Sie als Bibliothek oder Forschungseinrichtung digitale Publikationen und andere Daten zur langfristigen Nachnutzung aufbewahren wollen, stehen Sie also vor einer technischen Herausforderung. Deshalb ist Langzeitarchivierung in allen Forschungsbereichen ein wichtiges und zunehmend schwieriges Thema.

 

Welche besonderen Herausforderungen bestehen bei den medizinischen Forschungsdaten?

Durch die immer bessere Technologie entstehen in der Medizin gigantische Datenmengen. Beispielsweise bei bildgebenden Verfahren wie MRT (Magnetresonanztomographie) und CT (Computertomographie) werden heute bereits vierdimensionale Daten aufgenommen. Die Geräte erzeugen aus Schnitten durch Gewebeschichten nicht nur 3D-Daten, sondern zeichnen als vierte Dimension auch Veränderungen im Zeitablauf auf. Pro Sekunde werden 25 Bilder erzeugt – das ergibt eine Datenmenge von ca. einem Gigabyte (= 1024 MB) pro Bilddatensatz für einen einzigen Patienten.

Weltweit bewegt man sich in der medizinischen Bildgebung bei den jährlich erzeugten Datenmengen in Größenordnungen von Petabytes, das entspricht einer Eins mit 15 Nullen. Der Medizininformatiker Barry Robson prognostizierte 2009¹ nur für diesen Bereich weltweit ein Aufkommen von 150 Petabyte pro Jahr. Archiviert man solche Datenmengen über mehrere Jahre, gelangt man in Größenordnungen von Exabytes - das entspricht einer Eins mit 18 Nullen. Dass es schwierig werden könnte, in solchen Datenmengen noch Inhalte gezielt wieder zu finden, kann man sich unschwer vorstellen.
 

Welche Lösungen gibt es dafür momentan?

An den Universitäten erfolgt die Langzeitarchivierung derzeit in den Rechenzentren. Dort liegen häufig genutzte wissenschaftliche Daten auf schnellen Festplatten und sind leicht abrufbar. Weniger frequentierte Daten liegen auf Bandspeichergeräten. Sie bieten sehr viel Speicherplatz, sind preiswerter aber auch deutlich langsamer als Festplatten. Wenn man Daten von einem Bandspeicher auf einen anderen bzw. neuen migrieren möchte, kann das leicht mehrere Monate dauern.

Momentan sind spezielle Arbeitsgruppen und Institutionen im Aufbau, die sich mit der Langzeitarchivierung von Forschungsdaten beschäftigen. Häufig sind dabei die Uni-Bibliotheken mit einbezogen.
 

Wie sehen die Anforderungen der Wissenschaftler an die Langzeitarchivierung aus?

Wissenschaftler müssen wissen, wie sie an die archivierten Daten wieder herankommen. Da sie häufig in Forschungsverbünden, interdisziplinär und an verteilten Standorten arbeiten, reicht ein einfacher FTP-Server als Speicherort für Forschungsdaten nicht aus. Neben einem abgesicherten Datenzugriff ist es außerdem wichtig, dass man in Forscherteams einheitliche Datenformate und eindeutige Datenbeschreibungen verwendet.

Dateien müssen technische Metadaten mitführen, wie z.B. einen Zeitstempel und Informationen über das Programm und das Messgerät, mit dem die Nutzdaten erzeugt wurden. Mit intellektuellen Metadaten muss zusätzlich in standardisierter Form beschrieben werden, was die Datei enthält. Mit einer solchen intellektuellen Beschreibung bleiben Daten auch nach Jahrzehnten noch interpretierbar. Bei medizinischen Daten müssen außerdem natürlich die Anforderungen des Datenschutzes erfüllt sein. 
 

Auch die Grid-Technologie kommt beim Thema Langzeitarchivierung ins Spiel. Warum?

Grid2 ermöglicht die Verarbeitung sehr großer Datenmengen und den Zugriff auf diese Daten – also genau das, was in der Langzeitarchivierung gefordert ist. Ein Grid beinhaltet mit der „Public Key Infrastructure“ (PKI) auch Sicherheitsinfrastrukturen, die den Datenschutz gewährleisten. Nutzer müssen sich beispielsweise über elektronische Zertifikate, authentifizieren, das ist ähnlich wie bei der Online-Steuererklärung über Elster. Über diese Authentifizierung mit so genannten X.509-Zertifikaten weiß das System, wer man ist und welche Daten man einsehen und nutzen darf.

 

Welche  Fragestellungen und Ziele sollen in dem Projekt "Langzeitarchivierung biomedizinischer Forschungsdaten" bearbeitet werden?

Zielrichtung unseres Projekts, an dem unter anderem auch die TMF – Technologie- und Methodenplattform für die vernetzte medizinische Forschung e.V. und die Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften (AWMF) beteiligt sind, ist eine Laborimplementierung auf Basis vorhandener Grid-Technologie. Bis April 2013 sollen anhand von zwei Nutzungsfällen speziell die Aspekte Metadaten und Formatstandard für die biomedizinische Forschung adressiert werden. Hierfür werden wir exemplarisch mit Bilddaten vom Universitätsklinikum Magdeburg und mit Genomdaten vom Universitätsklinikum Schleswig-Holstein in Kiel  arbeiten. Das Projekt wird auch das Problem bearbeiten, wie man Daten aus wissenschaftlichen Rechenzentren  effizient wieder herausholt.

Ein weiterer Aspekt wird die Entwicklung eines Betriebskonzeptes zur Sicherung der langfristigen Finanzierung von virtuellen Langzeitarchiven sein. Forscher sollten idealerweise in Zukunft schon bei der Antragstellung den Finanzbedarf für die Langzeitarchivierung berücksichtigen.
 

 


¹ Barry Robson, „The engines of Hippocrates, John Wiley & Sons Inc. (2009), S.17

2 Unter dem Begriff Grid verbirgt sich eine Infrastruktur, die es auch wenig geübten und unerfahrenen Nutzern gestatten soll, Ressourcen jedweder Art (Hardware, Software, Datenbanken, Laborgeräte und Wissen) in einfacher, sicherer und transparenter Weise nutzen zu können. (Quelle: www.pt-it.pt-dlr.de)


News Archiv

September 2023 (7)

August 2023 (2)

Juli 2023 (4)

Juni 2023 (4)

Mai 2023 (6)

April 2023 (4)

März 2023 (3)

Februar 2023 (5)

Januar 2023 (5)

Dezember 2022 (4)

November 2022 (2)

Oktober 2022 (4)

September 2022 (4)

August 2022 (5)

Juli 2022 (4)

Juni 2022 (7)

Mai 2022 (6)

April 2022 (4)

März 2022 (5)

Februar 2022 (1)

Januar 2022 (6)

Dezember 2021 (7)

November 2021 (5)

Oktober 2021 (4)

September 2021 (2)

August 2021 (1)

Juli 2021 (4)

Juni 2021 (6)

Mai 2021 (4)

April 2021 (1)

März 2021 (3)

Februar 2021 (4)

Januar 2021 (4)

Dezember 2020 (3)

November 2020 (4)

Oktober 2020 (3)

August 2020 (1)

Juli 2020 (2)

Juni 2020 (2)

Mai 2020 (2)

April 2020 (4)

März 2020 (4)

Februar 2020 (3)

Januar 2020 (1)

Dezember 2019 (3)

November 2019 (5)

Oktober 2019 (3)

September 2019 (8)

August 2019 (2)

Juli 2019 (4)

Juni 2019 (4)

Mai 2019 (5)

April 2019 (3)

März 2019 (5)

Februar 2019 (2)

Januar 2019 (2)

Dezember 2018 (6)

November 2018 (5)

Oktober 2018 (9)

September 2018 (5)

August 2018 (3)

Juli 2018 (2)

Juni 2018 (7)

Mai 2018 (1)

April 2018 (1)

März 2018 (7)

Februar 2018 (2)

Januar 2018 (7)

Dezember 2017 (6)

November 2017 (2)

Oktober 2017 (3)

September 2017 (4)

August 2017 (1)

Juli 2017 (8)

Juni 2017 (9)

Mai 2017 (4)

April 2017 (2)

März 2017 (5)

Februar 2017 (2)

Januar 2017 (4)

Dezember 2016 (8)

November 2016 (5)

Oktober 2016 (4)

September 2016 (7)

August 2016 (5)

Juli 2016 (8)

Juni 2016 (5)

Mai 2016 (3)

April 2016 (11)

März 2016 (5)

Februar 2016 (3)

Januar 2016 (8)

Dezember 2015 (6)

November 2015 (3)

Oktober 2015 (8)

September 2015 (5)

August 2015 (4)

Juli 2015 (7)

Juni 2015 (7)

Mai 2015 (5)

April 2015 (2)

März 2015 (6)

Februar 2015 (7)

Januar 2015 (8)

Dezember 2014 (6)

November 2014 (9)

Oktober 2014 (10)

September 2014 (3)

Juli 2014 (6)

Juni 2014 (5)

Mai 2014 (4)

April 2014 (8)

März 2014 (8)

Februar 2014 (6)

Januar 2014 (7)

Dezember 2013 (8)

November 2013 (6)

Oktober 2013 (5)

September 2013 (10)

August 2013 (4)

Juli 2013 (8)

Juni 2013 (7)

Mai 2013 (4)

April 2013 (9)

März 2013 (9)

Februar 2013 (5)

Januar 2013 (5)

Dezember 2012 (7)

November 2012 (5)

Oktober 2012 (5)

September 2012 (5)

August 2012 (3)

Juli 2012 (4)

Juni 2012 (4)

Mai 2012 (3)

April 2012 (3)

März 2012 (5)

Januar 2012 (7)

Dezember 2011 (2)

November 2011 (8)

Oktober 2011 (10)

September 2011 (2)

August 2011 (5)

Juli 2011 (3)

Juni 2011 (5)

Mai 2011 (8)

April 2011 (4)

März 2011 (5)

Februar 2011 (3)

Januar 2011 (5)

Dezember 2010 (3)

November 2010 (3)

Oktober 2010 (5)

September 2010 (9)

August 2010 (5)

Juli 2010 (6)

Juni 2010 (12)

Mai 2010 (3)

April 2010 (4)

März 2010 (4)

Februar 2010 (4)

Januar 2010 (1)

Dezember 2009 (1)

November 2009 (1)

Oktober 2009 (5)

September 2009 (8)

August 2009 (1)

Juli 2009 (8)

Juni 2009 (6)

Mai 2009 (2)

April 2009 (6)

März 2009 (5)

Februar 2009 (4)

Januar 2009 (2)

Dezember 2008 (3)

November 2008 (6)

Oktober 2008 (3)

September 2008 (5)

August 2008 (3)

Juli 2008 (5)

Juni 2008 (4)

Mai 2008 (3)

April 2008 (6)

März 2008 (3)

Februar 2008 (1)

Januar 2008 (2)

Dezember 2007 (2)

November 2007 (4)

Oktober 2007 (4)

September 2007 (5)

Juni 2007 (2)

Mai 2007 (1)

April 2007 (6)

Januar 2007 (1)

Dezember 2006 (8)

November 2006 (4)

Oktober 2006 (1)

September 2006 (4)

August 2006 (1)

Juli 2006 (1)

Juni 2006 (3)

Mai 2006 (1)

April 2006 (3)

März 2006 (1)

Februar 2006 (1)

Januar 2006 (2)

Dezember 2005 (3)

November 2005 (1)

Oktober 2005 (1)

September 2005 (2)

August 2005 (2)

Juli 2005 (3)

Juni 2005 (2)

April 2005 (4)

November 2004 (1)

Oktober 2004 (1)

September 2004 (1)

August 2004 (1)

Juni 2004 (2)

Mai 2004 (1)

Februar 2003 (1)

Presseschau

Termine

Interviews

„Nötig ist ein Gesamtkonzept"

Interview mit der EHEALTH.COM (Ausgabe 5/2023)


 
© TMF e.V. Glossar     Datenschutzhinweis     Info an den Webmaster     Seite drucken      Seitenanfang