Home
Über uns
Mitglieder
Arbeitsgruppen
Projekte
Produkte
Publikationen
Stellungnahmen
News
Interviews und Namensbeiträge
Newsletter
Presse
Termine
Stellenmarkt
Online-Services
 

 

„Alle, die mit medizinischen Daten umgehen, müssen sich des Reidentifikations­potenzials bewusst sein.“

Prof. Dr. Klaus Pommerening und Dr. Fabian Prasser im Interview zur Anonymisierung in der medizinischen Forschung und zum TMF-Workshop „ANONTrain“

07.07.2016. In der medizinischen Forschung werden unterschiedliche Maßnahmen ergriffen, um Patienten- oder Probandendaten vor Missbrauch zu schützen. Eine dieser Maßnahmen ist die Anonymisierung, bei der Datensätze von personenbezogenen Angaben bereinigt werden. Dabei besteht eine wesentliche Herausforderung darin, eine möglichst hohe Brauchbarkeit der Daten bei möglichst geringem Reidentifikationsrisiko zu erhalten. Der TMF-Workshop „ANONTrain“ will die Kompetenz von Forschern auf dem Gebiet der Anonymisierung stärken. Prof. Dr. Klaus Pommerening (Universitätsmedizin Mainz) und Dr. Fabian Prasser (Klinikum rechts der Isar der TU München) erläutern im Interview, welche Herausforderungen die Anonymisierung von medizinischen Daten heute mit sich bringt und wie der Workshop für eine angemessene Anonymisierung sensibilisieren will.

Herr Pommerening, in welchen Anwendungsfällen ist eine Anonymisierung von medizinischen Forschungsdaten relevant? Wann ist eine Anonymisierung einer Pseudonymisierung vorzuziehen?

Pommerening: Zunächst sollte man grundsätzlich zwischen Datenspeicherung und Auswertung unterscheiden. Ein Pseudonym erlaubt es, Daten nachzuerheben, Daten aus verschiedenen Quellen zusammenzuführen und auch den Kontakt zum Betroffenen bei Bedarf wieder herzustellen. Alles dies würde verhindert, wenn die Datensätze anonymisiert sind. Daher sollten Daten, die für medizinische Forschungszwecke gespeichert werden, durch Pseudonyme geschützt, aber nicht anonymisiert werden.

Werden die Daten dann Dritten zur Verfügung gestellt, also beispielsweise für eine Auswertung herausgegeben, sollte Anonymität so gut wie möglich sichergestellt werden. Dabei ist eine perfekte Anonymisierung oft mit dem Auswertungszweck nicht vereinbar; daher sind Werkzeuge nötig, die es erlauben, den Grad und die Art der Anonymisierung zu steuern. Zur Publikation vorgesehene Auswertungsergebnisse müssen natürlich absolut anonym sein.
 
Was sind die Herausforderungen einer Anonymisierung von medizinischen Daten heute? Was benötigt man dazu?

Pommerening: Das Hauptproblem ist zum einen der große Umfang heutiger Forschungsdatensätze. Um medizinische Daten sinnvoll auswerten zu können, braucht man in der Regel viele Detailangaben. Zum anderen gibt es immer mehr potenziell überlappende Daten aus anderen Quellen. Hat ein Patient z. B. drei aufeinander folgende Blutdruckwerte mit Datum ins Internet gestellt, könnten diese ihn schon eindeutig charakterisieren − wie ein Fingerabdruck.

Auch wenn genomische Daten für eine individuelle Therapie verwendet werden – wie es heute unter dem Stichwort „personalisierte Medizin“ zunehmend geschieht – ist eine Eindeutigkeit schnell erreicht. Man braucht also erstens Werkzeuge, also Software, die es ermöglichen, einen Datensatz so gut wie möglich von potenziell identifizierenden Merkmalen zu bereinigen. Allerdings bleibt in den meistens Fällen ein Rest- Identifikationsrisiko, wenn die Daten noch für eine Auswertung brauchbar sein sollen. Daher müssen zweitens trotz einer möglichst guten Anonymisierung für die Daten Zugriffs- und Nutzungsbeschränkungen vorgesehen werden, um Restrisiken auszuschließen. Sogenannte Public-Use-Dateien mit medizinischen Daten verbieten sich in der Regel von selbst.
 
Herr Prasser, Sie haben das Anonymisierungstool „ARX“ entwickelt, dessen Handhabung im TMF-Trainingsworkshop geschult wird. Welche Funktionen und Vorteile bietet es?

Prasser: Daten werden typischerweise durch Veränderung von Merkmalsausprägungen anonymisiert. Die wesentliche Herausforderung besteht dabei darin, eine möglichst hohe Datenqualität (beispielsweise bezogen auf eine geplante Auswertung) bei gleichzeitig möglichst geringem Reidentifikationsrisiko zu erreichen. Beide Ziele stehen leider in einem inhärenten Widerspruch zueinander. Das Anonymisierungstool ARX zeichnet sich insbesondere dadurch aus, dass es eine Vielzahl von Modellen und Methoden für die wesentlichen Aspekte des Anonymisierungsprozesses unterstützt: für die Veränderung von Daten, für die Analyse der Datenqualität sowie für die Bestimmung von Risiken und Schutzniveaus. Diese breite Methodenunterstützung ist zwingend notwendig, um eine optimale Abwägung zu ermöglichen.

Darüber hinaus ist ARX in der Lage, sehr große Datenmengen effizient zu verarbeiten, und es bietet neben einer Softwarebibliothek eine umfangreiche graphische Benutzeroberfläche, die die bereitgestellten Methoden für Endanwender, beispielsweise Forscher, verhältnismäßig leicht zugänglich macht. Insbesondere die letztgenannte Eigenschaft macht die Software für einen praktischen Einsatz zu Schulungszwecken interessant.
 
Funktioniert die Anonymisierung dadurch „auf Knopfdruck“? Welche Aspekte muss man dabei bedenken?

Prasser: Da Datenqualität und Reidentifikationsrisiken meist kontextspezifisch abgewogen werden müssen, kann eine Anonymisierung in der Regel nicht auf Knopfdruck erfolgen. Vielmehr ist es notwendig, den gesamten Prozess an einen vorliegenden Anwendungsfall anzupassen, d. h. an den zu anonymisierenden Datensatz und den Datenempfänger. Das schließt, wie bereits erwähnt, neben dem Verändern von Daten ein breites Spektrum weiterer Maßnahmen mit ein. So kann beispielsweise die Menge möglicher Angriffe kontrolliert werden, indem eine Analyse von anonymisierten Daten nur innerhalb der geschützten Räume des Datenverantwortlichen erlaubt wird. Hier ist eine wechselseitige Abstimmung zwischen solchen Sekundärmaßnahmen und der eigentlichen Datenbereinigung notwendig.

Idealerweise wird die Expertise in all diesen Bereichen an einer entsprechenden Stelle gebündelt, beispielsweise den Datenintegrationszentren, die im Rahmen des BMBF-Förderkonzeptes Medizininformatik aufgebaut werden sollen. Grundsätzlich werden sich starke Anonymisierungsverfahren voraussichtlich eher im Bereich „Big Data“ durchsetzen, wo es darum geht, Muster aus großen Datenmengen zu extrahieren und neue Hypothesen zu generieren. In Bereichen, wo feingranulare Datensätze mit strengen Anforderungen an die statistische Validität benötigt werden, spielen Sekundärmaßnahmen eine größere Rolle.
 
Die Resonanz auf den ANONTrain-Workshop ist sehr groß. Wie läuft er ab? Was lernen die Teilnehmer?

Prasser: Neben einer Einführung in das Thema und seine rechtlichen Rahmenbedingungen lernen die Teilnehmer natürlich den Umgang mit der Anonymisierungssoftware ARX. Das ist aber mehr ein Mittel zum Zweck. Der wesentliche Lerninhalt besteht darin, dass die Teilnehmer einen gründlichen Einblick in die Vielzahl verfügbarer Methoden erhalten und ihre Vor- und Nachteile selbst herausarbeiten. Dies umfasst beispielsweise verschiedene Möglichkeiten, mit denen das Hintergrundwissen eines Angreifers bei der Bestimmung und Reduktion von Risiken berücksichtigt werden kann, und welche Restrisiken dabei verbleiben.

Darüber hinaus werden in den praktischen Übungen wesentliche Kompromisse vermittelt, die bei der Datenanonymisierung eingegangen werden müssen. Zum Beispiel arbeiten die Teilnehmer heraus, wie sich die Dimensionalität und das Volumen eines Datensatzes auf die Qualität der Ausgabedaten auswirken. Diese Inhalte stellen einen Einstieg in die Problematik dar.
 
Was erhoffen Sie sich von einer so intensiven Beschäftigung mit dem Thema Anonymisierung für die Community?

Pommerening: Zunächst ist wichtig, dass alle, die mit medizinischen Daten umgehen, sich deren Reidentifikationsspotenzial bewusst sind. Hier ist schon der testweise Einsatz eines Anonymisierungswerkzeugs ein Augenöffner – man sieht den Konflikt zwischen Anonymität und Brauchbarkeit der Daten sehr deutlich und lernt die Möglichkeiten sowie die Grenzen entsprechender Verfahren kennen. Dann ist es natürlich wichtig, im konkreten Fall das Werkzeug sachgemäß anzuwenden. Die Komplexität des Problems bringt es mit sich, dass das keine triviale Anforderung ist, sondern einiges an Know-how erfordert. Dieses kann nur durch gründliche Schulung erworben werden.

Es wäre sehr verdienstvoll, wenn die TMF hierzu regelmäßige Kurse anbieten oder vermitteln könnte. Darüber hinaus wäre die Erarbeitung eines Standardvorgehens zur Anonymisierung − im Sinne eines Best-Practice-Leitfadens − für Anwender überaus hilfreich. 
 
Das Interview führte Inger Neick.  

 
   
Prof. Dr. Klaus Pommerening ist habilitierter Mathematiker und Professor im Ruhestand. Er leitete die Abteilung Medizinische Informatik an der Universitätsmedizin Mainz. Einer seiner Schwerpunkte ist Datenschutz und Datensicherheit. Er ist langjähriger Sprecher der TMF-Arbeitsgruppe Datenschutz und Koautor des TMF-Leitfadens zum Datenschutz in medizinischen Forschungsprojekten. [Bild: prasser.jpg]
 

 

 

   

Dr. Fabian Prasser ist promovierter Diplom-Informatiker. Seine Forschungsarbeit am Institut für Medizinische Statistik und Epidemiologie des Klinikums rechts der Isar der TU München konzentriert sich auf Methoden zum Schutz medizinischer Daten. Er ist einer der Hauptentwickler des Anonymisierungswerkzeugs ARX.


Weiterführende Informationen

  1. Programmflyer zum Workshop „ANONTrain: Praktische Anwendung von Anonymisierungswerkzeugen“ [PDF | 135 KB]
  2. Projektwebsitedes ANONTrain-Schulungskonzepts

News Archiv

September 2023 (7)

August 2023 (2)

Juli 2023 (4)

Juni 2023 (4)

Mai 2023 (6)

April 2023 (4)

März 2023 (3)

Februar 2023 (5)

Januar 2023 (5)

Dezember 2022 (4)

November 2022 (2)

Oktober 2022 (4)

September 2022 (4)

August 2022 (5)

Juli 2022 (4)

Juni 2022 (7)

Mai 2022 (6)

April 2022 (4)

März 2022 (5)

Februar 2022 (1)

Januar 2022 (6)

Dezember 2021 (7)

November 2021 (5)

Oktober 2021 (4)

September 2021 (2)

August 2021 (1)

Juli 2021 (4)

Juni 2021 (6)

Mai 2021 (4)

April 2021 (1)

März 2021 (3)

Februar 2021 (4)

Januar 2021 (4)

Dezember 2020 (3)

November 2020 (4)

Oktober 2020 (3)

August 2020 (1)

Juli 2020 (2)

Juni 2020 (2)

Mai 2020 (2)

April 2020 (4)

März 2020 (4)

Februar 2020 (3)

Januar 2020 (1)

Dezember 2019 (3)

November 2019 (5)

Oktober 2019 (3)

September 2019 (8)

August 2019 (2)

Juli 2019 (4)

Juni 2019 (4)

Mai 2019 (5)

April 2019 (3)

März 2019 (5)

Februar 2019 (2)

Januar 2019 (2)

Dezember 2018 (6)

November 2018 (5)

Oktober 2018 (9)

September 2018 (5)

August 2018 (3)

Juli 2018 (2)

Juni 2018 (7)

Mai 2018 (1)

April 2018 (1)

März 2018 (7)

Februar 2018 (2)

Januar 2018 (7)

Dezember 2017 (6)

November 2017 (2)

Oktober 2017 (3)

September 2017 (4)

August 2017 (1)

Juli 2017 (8)

Juni 2017 (9)

Mai 2017 (4)

April 2017 (2)

März 2017 (5)

Februar 2017 (2)

Januar 2017 (4)

Dezember 2016 (8)

November 2016 (5)

Oktober 2016 (4)

September 2016 (7)

August 2016 (5)

Juli 2016 (8)

Juni 2016 (5)

Mai 2016 (3)

April 2016 (11)

März 2016 (5)

Februar 2016 (3)

Januar 2016 (8)

Dezember 2015 (6)

November 2015 (3)

Oktober 2015 (8)

September 2015 (5)

August 2015 (4)

Juli 2015 (7)

Juni 2015 (7)

Mai 2015 (5)

April 2015 (2)

März 2015 (6)

Februar 2015 (7)

Januar 2015 (8)

Dezember 2014 (6)

November 2014 (9)

Oktober 2014 (10)

September 2014 (3)

Juli 2014 (6)

Juni 2014 (5)

Mai 2014 (4)

April 2014 (8)

März 2014 (8)

Februar 2014 (6)

Januar 2014 (7)

Dezember 2013 (8)

November 2013 (6)

Oktober 2013 (5)

September 2013 (10)

August 2013 (4)

Juli 2013 (8)

Juni 2013 (7)

Mai 2013 (4)

April 2013 (9)

März 2013 (9)

Februar 2013 (5)

Januar 2013 (5)

Dezember 2012 (7)

November 2012 (5)

Oktober 2012 (5)

September 2012 (5)

August 2012 (3)

Juli 2012 (4)

Juni 2012 (4)

Mai 2012 (3)

April 2012 (3)

März 2012 (5)

Januar 2012 (7)

Dezember 2011 (2)

November 2011 (8)

Oktober 2011 (10)

September 2011 (2)

August 2011 (5)

Juli 2011 (3)

Juni 2011 (5)

Mai 2011 (8)

April 2011 (4)

März 2011 (5)

Februar 2011 (3)

Januar 2011 (5)

Dezember 2010 (3)

November 2010 (3)

Oktober 2010 (5)

September 2010 (9)

August 2010 (5)

Juli 2010 (6)

Juni 2010 (12)

Mai 2010 (3)

April 2010 (4)

März 2010 (4)

Februar 2010 (4)

Januar 2010 (1)

Dezember 2009 (1)

November 2009 (1)

Oktober 2009 (5)

September 2009 (8)

August 2009 (1)

Juli 2009 (8)

Juni 2009 (6)

Mai 2009 (2)

April 2009 (6)

März 2009 (5)

Februar 2009 (4)

Januar 2009 (2)

Dezember 2008 (3)

November 2008 (6)

Oktober 2008 (3)

September 2008 (5)

August 2008 (3)

Juli 2008 (5)

Juni 2008 (4)

Mai 2008 (3)

April 2008 (6)

März 2008 (3)

Februar 2008 (1)

Januar 2008 (2)

Dezember 2007 (2)

November 2007 (4)

Oktober 2007 (4)

September 2007 (5)

Juni 2007 (2)

Mai 2007 (1)

April 2007 (6)

Januar 2007 (1)

Dezember 2006 (8)

November 2006 (4)

Oktober 2006 (1)

September 2006 (4)

August 2006 (1)

Juli 2006 (1)

Juni 2006 (3)

Mai 2006 (1)

April 2006 (3)

März 2006 (1)

Februar 2006 (1)

Januar 2006 (2)

Dezember 2005 (3)

November 2005 (1)

Oktober 2005 (1)

September 2005 (2)

August 2005 (2)

Juli 2005 (3)

Juni 2005 (2)

April 2005 (4)

November 2004 (1)

Oktober 2004 (1)

September 2004 (1)

August 2004 (1)

Juni 2004 (2)

Mai 2004 (1)

Februar 2003 (1)

Presseschau

Termine

Interviews

„Nötig ist ein Gesamtkonzept"

Interview mit der EHEALTH.COM (Ausgabe 5/2023)


 
© TMF e.V. Glossar     Datenschutzhinweis     Info an den Webmaster     Seite drucken      Seitenanfang