banner

Blog

May 28, 2023

Wie architektonische Privatsphäre

Quelle: Getty Images

31. August 2023 – Datenanalysen sind für die Verbesserung der Qualität der Gesundheitsversorgung und medizinische Durchbrüche von entscheidender Bedeutung, aber der Schutz der Patientendaten muss während des gesamten Prozesses Priorität haben.

Datenschutzverbessernde Technologien (PETs) sind wichtige Instrumente, die Gesundheitsorganisationen für den Datenschutz und die Datensicherheit nutzen können. PETs können in drei Kategorien unterteilt werden: algorithmische, architektonische und Augmentation. Zur Unterstützung der Gesundheitsanalytik wird eine Kombination dieser Typen empfohlen.

Dies ist der zweite Teil einer Serie, die jede PET-Kategorie und ihre Anwendungsfälle im Gesundheitswesen aufschlüsselt und sich eingehend mit algorithmischen PETs befasst.

Hier wird HealthITAnalytics den zweiten Typ untersuchen: architektonische PETs.

Im Gegensatz zu algorithmischen PETs, die die Darstellung von Daten zum Schutz der Privatsphäre verändern, befassen sich architektonische PETs mit der Struktur der Daten oder Rechenumgebungen. Diese PETs konzentrieren sich auf den vertraulichen Austausch von Informationen, ohne die zugrunde liegenden Daten weiterzugeben.

Federated Learning ist ein Ansatz, der häufig bei der Entwicklung von Modellen für künstliche Intelligenz (KI) und maschinelles Lernen (ML) verwendet wird.

IBM konzipiert föderiertes Lernen als eine Methode, die dabei hilft, diese Modelle zu trainieren, ohne dass jemand Zugriff auf die Daten hat, die dem Modell selbst zugrunde liegen:

„Beim föderierten Lernen teilen mehrere Personen ihre Daten aus der Ferne, um gemeinsam ein einzelnes Deep-Learning-Modell zu trainieren und es iterativ zu verbessern, beispielsweise bei einer Teampräsentation oder einem Teambericht. Jede Partei lädt das Modell von einem Rechenzentrum in der Cloud herunter, normalerweise ein vorab trainiertes Basismodell. Sie trainieren es anhand ihrer privaten Daten, fassen dann die neue Konfiguration des Modells zusammen und verschlüsseln sie. Die Modellaktualisierungen werden an die Cloud zurückgesendet, entschlüsselt, gemittelt und in das zentralisierte Modell integriert. Iteration für Iteration wird das kollaborative Training fortgesetzt, bis das Modell vollständig trainiert ist.“

Untersuchungen zeigen, dass sich die meisten föderierten Lernanwendungen für biomedizinische Daten auf Radiologie und Onkologie konzentrieren. Einige Anwendungsfälle umfassen die Bildgebung des Gehirns, die COVID-19-Diagnose, die Tumorerkennung, die Vorhersage von Krebs-Biomarkern und Anwendungen für das Internet der Gesundheitsfürsorge (IoHT). Forscher haben außerdem einen föderierten Lernrahmen vorgeschlagen, um die Fairness bei KI-basierten Screening-Tools zu verbessern.

Forscher der Perelman School of Medicine an der University of Pennsylvania (Penn) führten 2018 die erste Anwendung des föderierten Lernens in realen medizinischen Bilddaten durch.

Die Studie, die diese Bemühungen beschreibt, wurde 2019 veröffentlicht und zeigt, dass ein durch föderiertes Lernen trainiertes Deep-Learning-Modell Hirntumorbilder genau segmentieren kann und 99 Prozent der Leistung desselben Modells erreicht, wenn es mit herkömmlichen Datenaustauschmethoden trainiert wird.

Die Arbeit trug dazu bei, die Machbarkeit des Einsatzes von föderiertem Lernen zur Bewältigung der Herausforderungen bei der Datenerfassung, -kennzeichnung und -freigabe zu ermitteln, die typischerweise mit der Bildanalyseforschung verbunden sind.

Im selben Jahr erhielten Forscher am Penn's Center for Biomedical Image Computing & Analytics (CBICA) ein dreijähriges Bundesstipendium in Höhe von 1,2 Millionen US-Dollar für die Entwicklung eines gemeinsamen Lernrahmens mit Schwerpunkt auf der Tumorsegmentierung.

Der Zuschuss führte dazu, dass Penn eine Zusammenarbeit von 29 Institutionen auf der ganzen Welt anführte, um diese Bemühungen voranzutreiben.

Zu den potenziellen Vorteilen föderierter, auf Lernen basierender Gesundheitsanwendungen gehören die Verbesserung des Datenschutzes, das Erreichen eines Gleichgewichts zwischen Genauigkeit und Nutzen, die Ermöglichung eines kostengünstigen Trainings für Gesundheitsdaten und die Reduzierung der Datenfragmentierung. Der Ansatz ermöglicht auch asynchrone Übertragungen, die die Zusammenarbeit und Kommunikation zwischen mehreren Institutionen stärken können.

Da föderiertes Lernen es Benutzern ermöglicht, das Modell auf die Daten zu verschieben, anstatt umgekehrt, erfordert das lokale Modelltraining nicht, dass hochdimensionale, speicherintensive medizinische Daten von jedem Benutzer dupliziert werden. Forscher weisen darauf hin, dass dies dazu beiträgt, dass das Modell auf natürliche Weise mit einem wachsenden Datensatz skaliert werden kann, ohne dass die Anforderungen an die Datenspeicherung steigen.

Federated Learning kann auch mit anderen PETs wie Differential Privacy und Secure Multi-Party Computing kombiniert werden, um zusätzliche Datenschutzanforderungen in der medizinischen Forschung zu erfüllen. Zu diesem Zweck arbeiten Experten daran, Strategien für das föderierte Lernen für biomedizinische Daten zu vergleichen.

Allerdings gibt es einige bemerkenswerte Herausforderungen bei der Anwendung von föderiertem Lernen in der Gesundheitsanalytik.

Wie andere PETs ist föderiertes Lernen rechenintensiv und erfordert eine hohe Kommunikationsbandbreite.

Transparenz ist ein weiteres Thema. Um die in einem föderierten Lernmodell verwendeten Trainingsdaten privat zu halten, ist die Verwendung eines Systems zum Testen der Genauigkeit, Fairness und potenziellen Verzerrung innerhalb der Modellausgaben erforderlich. Aufgrund der Neuheit der Technologie muss ein solches System jedoch noch entwickelt und weit verbreitet werden.

Forscher arbeiten daran, diese Herausforderungen anzugehen, wie ein aktueller Vorschlag für eine neuartige Architektur zeigt, um fehlende Werte, Datenharmonisierung und Schemaprobleme bei „Lernaufgaben“ anzugehen, die bei föderierten Lernbemühungen im biomedizinischen Bereich auftreten.

Bei der sicheren Mehrparteienberechnung handelt es sich um ein architektonisches PET, das es den Parteien ähnlich wie beim föderierten Lernen ermöglicht, Daten für Berechnungen auszutauschen, ohne diese Daten preiszugeben, weshalb beide häufig zusammen verwendet werden.

Experten betonen, dass sichere Mehrparteienberechnungen ein wichtiges Werkzeug für die Entwicklung groß angelegter Anwendungen zum Schutz der Privatsphäre sind, da sie „einer Gruppe die gemeinsame Durchführung einer Berechnung ermöglichen, ohne die privaten Eingaben eines Teilnehmers offenzulegen.“ Die Teilnehmer einigen sich auf eine zu berechnende Funktion und können dann ein [Mehrparteien-Berechnungs]-Protokoll verwenden, um gemeinsam die Ausgabe dieser Funktion anhand ihrer geheimen Eingaben zu berechnen, ohne sie preiszugeben.“

Für eine erfolgreiche sichere Mehrparteienberechnung müssen die Beteiligten außerdem fünf Prozesse einhalten: Datenschutz, Korrektheit, Unabhängigkeit der Eingaben, garantierte Ausgabe und Fairness.

Der Datenschutz erfordert, dass keine beteiligte Partei Informationen über andere Parteien erhält, und jede Partei sollte nur die berechnete Ausgabe erhalten, und Korrektheit trägt dazu bei, sicherzustellen, dass die Ausgabe korrekt ist. Die Unabhängigkeit der Eingaben schreibt vor, dass die erforderlichen Eingaben von jeder Partei unabhängig bereitgestellt werden müssen, während der garantierte Output angibt, dass alle Parteien die Ausgabe erhalten sollten. Es erfordert aber auch, dass die Parteien bereit sind, die Ergebnisse zu respektieren.

Schließlich besagt Fairness, dass jede Partei nur dann berechnete Ergebnisse erhalten sollte, wenn alle anderen Parteien ihre Ergebnisse erhalten.

Sichere Mehrparteienberechnungen werden evaluiert, um die Genomforschung und die Risikostratifizierung von Patienten zu stärken. Forscher untersuchen außerdem, wie sichere Mehrparteienberechnungen die datenschutzwahrende Analyse von Gesundheitsdaten unterstützen können, und entwickeln sichere, auf Mehrparteienberechnungen basierende Tools für die biomedizinische Forschung.

Die Verwendung dieses PET in anderen Branchen verdeutlicht einige seiner wichtigsten Vorteile. Eine Studie zur Bewertung des Einsatzes sicherer Mehrparteienberechnungen in der Automobilindustrie ergab, dass das Tool neue Strategien für die technologiebasierte Steuerung ermöglicht, den Bedarf an Vertrauen zwischen Organisationen verringert und den Verlust von Wettbewerbsvorteilen aufgrund von Datenlecks verhindert.

Trotz dieser Vorteile gibt es mehrere Einschränkungen bei der Verwendung sicherer Mehrparteienberechnungen.

Das PET verlangt von den Interessengruppen, dass sie der Technologie vertrauen, was im Gesundheitswesen eine Herausforderung darstellt, da Ärzte und Interessengruppen im Gesundheitswesen möglicherweise zögern, sich auf ein „Black-Box“-Tool einzulassen.

Der Ansatz kann auch neue Risiken des Datenmissbrauchs mit sich bringen. Eine sichere Mehrparteienberechnung erfordert ein gewisses Maß an Kommunikation zwischen den Parteien, und die Art des PET birgt die Möglichkeit, dass zwei Parteien zusammenarbeiten, um die Daten eines Dritten zu ermitteln.

Wenn die ersten beiden Parteien bereit sind, ihre Daten miteinander zu teilen, besteht grundsätzlich die Möglichkeit, dass sie dadurch Rückschlüsse auf die Daten des Dritten ziehen. Um dies zu verhindern, müssen die Beteiligten über eine robuste, sichere Mehrparteien-Berechnungsstrategie verfügen und bestimmte Protokolle wie Datenschutzzonen implementieren.

Datenschutzzonen können mithilfe mehrerer Domänen oder Server eingerichtet werden, die jeweils eine Reihe von Datenschutzbeschränkungen enthalten. Die Verwendung des Privacy-Zone-Frameworks ermöglicht es verschiedenen Parteien, sichere Multi-Party-Berechnungen durchzuführen und gleichzeitig die Daten zu schützen, da keine dieser Daten auf denselben Servern gespeichert oder in denselben Domänen gespeichert sind.

Blockchain wird nicht immer als eigenständiges PET betrachtet, aber sie kann es sein, wenn sie mit Ansätzen wie sicherer Mehrparteienberechnung, homomorpher Verschlüsselung und wissensfreien Beweisen zum Schutz der Privatsphäre kombiniert wird.

Blockchain-Netzwerke sind Distributed-Ledger-Technologien, was bedeutet, dass sie es Beteiligten ermöglichen, Informationen ohne eine zentrale Instanz aufzuzeichnen, zu verfolgen, zu teilen und zu synchronisieren. Jeder auf einer Blockchain durchgeführte Austausch ist daher transparent, unveränderlich und dauerhaft.

Jeder Austausch oder jede Transaktion wird als „Datenblock“ mit einer eindeutigen Kennung in Form eines „Hash“ aufgezeichnet. Dieser Hash ändert sich, wenn die Informationen innerhalb des Blocks dies tun.

Die Blöcke werden dann mithilfe einer „Kette“ mit denen davor und danach verbunden, die sicherstellt, dass der Block nicht verändert werden kann. Die Kette gewährleistet außerdem, dass kein weiterer Block zwischen zwei bereits vorhandenen eingefügt werden kann.

Im Gesundheitswesen wird Blockchain zur Überwindung von IT-Barrieren eingesetzt und kann mit KI kombiniert werden, um Big-Data-Analysen voranzutreiben. Zu den vorgeschlagenen Blockchain-Anwendungen für das Gesundheitswesen gehören EHR-Interoperabilität, verbesserte Datensicherheit und Fog Computing für das Internet der Dinge (IoT).

Auch Life-Science-Organisationen haben Blockchain genutzt, um die Fruchtbarkeitsdaten von Patienten zu sichern. Dies ist ein potenziell wertvoller Anwendungsfall, da das Gesundheitswesen nach dem Sturz von Roe v. Wade die Privatsphäre der Patienten neu überdenkt und Experten auf die gemeinsame Nutzung von Gesundheitsdaten drängen, um die Privatsphäre der Patienten zu schützen.

Blockchains haben den Vorteil, dass sie häufig Netzwerke mit dezentraler Architektur verwenden, die auf mehreren Servern basieren, die als einzelne „Master“-Server für die Datenverwaltung fungieren können. Im Gesundheitswesen können diese Netzwerke dazu beitragen, den Datenfluss zu unterstützen und Datensilos aufzubrechen.

Um die Blockchain jedoch effektiv nutzen zu können, müssen Gesundheitsorganisationen verstehen, wie sie sich möglicherweise auf die Datensicherheit im Gesundheitswesen und andere Maßnahmen auswirkt. Zu den wichtigsten Überlegungen zählen neben der Sicherheit auch die Vertraulichkeit, die Datenspeicherung und die Datenverfügbarkeit.

Auch die branchenübergreifende Datenschutzkonformität der Blockchain war eine Herausforderung, insbesondere im Gesundheitswesen.

Untersuchungen in diesem Bereich legen nahe, dass eine Herausforderung darin besteht, die Anfälligkeiten für Angriffe innerhalb jeder Schicht der Blockchain-Architektur zu analysieren, um Datenschutzverletzungen zu verhindern. Die Verwendung von Blockchain zusammen mit anderen PETs kann dazu beitragen, einige dieser Risiken zu minimieren. Experten weisen jedoch darauf hin, dass jedes PET seine eigenen Mängel aufweist, sodass die Beteiligten zusätzlich zur Unterstützung der Entwicklung neuer PETs über eine starke Strategie zur Risikominderung verfügen müssen.

FÖDERIERTES LERNENSICHERE MEHRPARTEI-BERECHNUNGBLOCKCHAIN
AKTIE