InCor nutzt KI und HPC zur Ausweitung von Kapazitäten

Das Projekt in Zusammenarbeit mit Intel erweitert mithilfe anonymisierter Ergebnisse von Bildgebungstests die Forschungsmöglichkeiten.

Auf einen Blick:

  • InCor ist gemessen an der Anzahl der Besuche und der Kardiologie- und Pulmonologiefachgebiete eines der weltweit größten Kardiologiezentren und ein Referenzzentrum im Bereich der akademischen Forschung.

  • Ein Projekt zur automatisierten Datenanonymisierung erweiterte die Forschungsmöglichkeiten, indem die Ergebnisse von Bildgebungstests an Forschungsteams weitergegeben wurden. In Zusammenarbeit mit Intel nutzt InCor künstliche Intelligenz und hohe Verarbeitungskapazitäten, um kritische Daten zu identifizieren, zu anonymisieren und den Prozess zu automatisieren.

author-image

Von

InCor wurde 1977 gegründet und ist gemessen an der Anzahl der Besuche und der Kardiologie- und Pulmonologiefachgebiete eines der weltweit größten Kardiologiezentren und ein Referenzzentrum im Bereich der akademischen Forschung, die auf den Ergebnissen von Hunderttausenden von Bildgebungsuntersuchungen basiert, die die Einrichtung jährlich durchführt.

Das Forschungsteam von lnCor arbeitet seit 2012 an einem Projekt zur Anonymisierung von Patientendaten, um die Vertraulichkeit von Daten zu gewährleisten, damit das Team große Mengen an Untersuchungen für seine Forschungsprojekte verwenden kann. Im Jahr 2017 begann Intel mit der Unterstützung dieses Projekts, indem künstliche Intelligenz (KI) und hohe Verarbeitungskapazitäten in die Methode eingefügt wurden, mit der bildgebende Untersuchungen verarbeitet und verschiedenen Forschungsteams zur Verfügung gestellt werden.

Problemstellung

  • Automatisierung des Prozesses der Anonymisierung der aus bildgebenden Untersuchungen gewonnenen Patientendaten
  • Erhöhung des Bildgebungsvolumens, das Forschungsgruppen zur Verfügung steht
  • Unterstützung der Remote-Suche ohne Weitergabe kritischer Patientendaten

Lösung

  • Verwendung künstlicher Intelligenz und hoher Verarbeitungskapazitäten zur Identifizierung und Anonymisierung kritischer Daten und Automatisierung des Prozesses.

Fazit

  • Am Ende der ersten Phase des Projekts variieren die Datenerkennungsraten je nach Art der bildgebenden Untersuchung zwischen 60 % und 100 %.

Bis zum Ende diesen Jahres sollte alles validiert werden, was zu einem Prozess führt, bei dem die Methode zur Identifizierung von Informationen in Untersuchungen wissenschaftlich nachgewiesen wird.“ – Marco Antonio Gutierrez, IT-Leiter bei InCor

Die Bedeutung der Ergebnisse von bildgebenden Untersuchungen für die medizinische Forschung

Das Heart Institute der Universität von São Paulo (lnCor) führt jedes Jahr etwa 200.000 Bildgebungsstudien durch, von denen jede bis zu Tausenden von Bildern enthalten kann. Jährlich werden Hunderttausende von Patienten versorgt, die die Einrichtung aufsuchen. Außerdem hat die Einrichtung eine wichtige Datenbank für die Durchführung medizinischer Forschungsstudien erstellt.

InCor ist nicht nur ein Referenzzentrum für Kardiologie, sondern auch ein wichtiges Zentrum für die medizinische Forschung. Viele medizinische Forschungsstudien basieren auf den gesammelten Untersuchungen der Einrichtung. Die Normen der Medizinethik besagten jedoch, dass sensible Patientendaten nicht von Wissenschaftlern offengelegt werden dürfen, sondern vertraulich behandelt werden müssen.

Sensible Daten beziehen sich auf Informationen, die eine Identifizierung des Patienten ermöglichen, wie z. B. Name, Alter, Geburtsdatum. Diese Daten dürfen ohne vorherige Zustimmung des Patienten nicht von Krankenhäusern an Dritte weitergegeben werden. Bisher war die Anonymisierung von Daten äußerst schwierig, da an dem Ort, an dem die Daten in bildgebenden Untersuchungen gespeichert sind, kein Standard implementiert war und das Anzeigeformat jeder Untersuchung erheblich variiert.

Heute erfolgt die Gewährleistung des Datenschutzes anhand von Vertraulichkeitsvereinbarungen. Solche Vereinbarungen werden von den Wissenschaftlern unterzeichnet, die sich damit einverstanden erklären, kritische Daten zu den untersuchten Fällen nicht offenzulegen und in verantwortungsvoller Weise zu verwenden. Dieses Modell erlaubt jedoch nicht die massive Nutzung von Untersuchungen, die ausgewertet und deren Daten manuell anonymisiert werden müssen.

Aus diesem Grund arbeitet das Team von lnCor Technology seit 2012 an einem Projekt, um diese Informationen auf automatisierte Weise zu entfernen. Laut Marco Antonio Gutierrez, IT Chief bei lnCor, zeichnen medizinische Geräte bereits heute Patientendaten als Teil des Bildes selbst auf. „Und dies geschieht ohne Standardisierung. Informationen wie Körpergewicht, Größe, Alter und Geburtsdatum sind an verschiedenen Stellen im Bild zu finden“, so Gutierrez.

Laut Gutierrez bestand die ursprüngliche Idee darin, einen Roboter für diese Aufgabe zu entwickeln. „Anschließend haben wir einen Prototyp entwickelt, um Bildteile, die Textinformationen enthalten, zu identifizieren und unkenntlich zu machen. Dies war unser erster Versuch, dieses Problem zu lösen“, betont Gutierrez. Das Modell musste verbessert werden, da alle Textinformationen unkenntlich gemacht wurden.

„Viele Informationen, wie z. B. Untersuchungsdatum und Messwerte, mussten bewahrt werden. Wir standen vor der Herausforderung, unserem Roboter beizubringen, wie man sensible Daten von regulären Daten unterscheidet“, so Gutierrez. Laut Gutierrez unterteilte das Team von lnCor Technology in dieser ersten Phase des Projekts im Jahr 2017 den Prozess in drei Phasen: Identifizierung von Text in bildgebenden Untersuchungen, Konvertierung des Texts in eine Zeichenfolge und Unkenntlichmachen von Informationen.

Erhöhte Verarbeitungskapazitäten und Einsatz künstlicher Intelligenz zur Identifizierung sensibler Informationen

2017 erhielt das Roboterentwicklungsprojekt eine neue Dynamik. lnCor war eine Partnerschaft mit Intel eingegangen, in der Kl als einer der Schwerpunktbereiche für die Entwicklung neuer Lösungen identifiziert wurde. Laut Gutierrez fügte die gemeinsame Anstrengung mit Intel dem Prozess eine weitere Phase hinzu: die Bereitstellung eines Klassifikators durch künstliche Intelligenz.

„Kl wird in einer Phase vor der Unkenntlichmachung von Informationen eingesetzt und erkennt, ob es sich bei den Informationen um sensible Daten handelt oder nicht. Aus diesem Grund haben wir ein neuronales Netzwerk trainiert, das auf Anmerkungen basiert, die von einer Person erstellt werden. Nach diesem Training identifiziert das neuronale Netzwerk, bei welchen Informationen im Text es sich um sensible Daten handelt, und macht diese unkenntlich und vertraulich“, so Gutierrez.

In diesem Projekt setzte Intel ein Team von Software-Experten ein, die seit 2018 spezielle Ressourcen bereitstellen, um Kunden bei ihren ersten Kl-bezogenen Entwicklungsarbeiten zu unterstützen. „Wir analysierten, wie diese Art von Ressource verwendet werden kann, um die Anforderungen von lnCor zu erfüllen, und ermittelten die Notwendigkeit einer Datenanonymisierung aufgrund von Bildgebungsuntersuchungen, die vom Krankenhaus durchgeführt wurden, um deren Verwendung in großen Mengen in der Forschung zu ermöglichen“, so Andre Ribeiro, New Business Director bei Intel Brazil.

Der erste Schritt war ein Pilotprojekt, das im letzten Quartal 2018 durchgeführt wurde. Intel beauftragte Techniker mit Erfahrung in der Entwicklung von Kl-Lösungen und lnCor beauftragte ein eigenes technisches Team mit der Durchführung dieses Projekts. „Gemeinsam erstellten wir diesen Prototyp zur Anonymisierung bildgebender Untersuchungen. Es geht nicht nur um Röntgenuntersuchungen, sondern auch um Kernspintomografien und andere Untersuchungen, die jeweils mit einem anderen Gerät von einem anderen Hersteller durchgeführt werden“, so Ribeiro.

Dies bedeutet, dass für jede Untersuchung unterschiedliche Informationen auf unterschiedlichen Abschnitten des Bildes platziert sind. In der Praxis übermittelt das Kl-System eine Reihe verschiedener, auf verschiedenen Plattformen erstellter Untersuchungen an ein maschinelles Lernsystem, das den Computer darin trainiert zu erkennen, welche Daten aus diesem Bild eine Person identifizieren können. Sobald diese Daten identifiziert wurden, müssen diese Informationen unkenntlich gemacht werden, damit die Wissenschaftler den Patienten nicht identifizieren können.

„Unser Fokus liegt auf der Entwicklung einer Lösung, die sich auf die Patientenversorgung auswirkt und eine verbesserte Patientenversorgung und genauere Studien ermöglicht.“ – Guilherme Rabello, Commercial and Market Intelligence Manager bei InCor.

Insgesamt wurden 680 Bilder verwendet, um den Algorithmus zu trainieren. Später wurden weitere 320 Bilder verwendet, um den Algorithmus zu testen, einschließlich verschiedener Arten von Untersuchungen - einige mit elektrokardiographischer Verfolgung. Diese Gruppe von 1.000 Bildern bildete die erste Phase des Algorithmus-Trainings, dessen Ergebnisse vom lnCor-Team als positiv bewertet wurden.

„Bei Cineangiokardiographie-Untersuchungen erreichten wir eine Genauigkeit von 100 %, bei kardiovaskulären Ultraschalluntersuchungen etwa 60 % und bei Elektrokardiogrammen mehr als 50 %, verrät Gutierrez und betont, dass beim Menschen der Genauigkeitsbereich bei der Identifizierung sensibler Daten im Allgemeinen 85 % beträgt.

Abbildung 1: Anonymisierungsbeispiel einer Studie mit koronarer Cineangiographie. Textinformationen mit sensiblen Daten wurden mit einer blauen Markierung gekennzeichnet.

Das System identifiziert nicht nur sensible Daten von Patienten, sondern zeichnet auch alle Bilder im DICOM-Standard (Digital Imaging and Communications in Medicine) auf, um die Datenkompatibilität zwischen verschiedenen Geräten sicherzustellen.

Mit diesen Ergebnissen bereitet sich lnCor darauf vor, 2020 eine neue Phase des Trainings für neuronale Netzwerke durchzuführen, die jetzt 10.000 Bilder umfasst. Diese neue Phase wird ebenso von Intel unterstützt. „Es ist eine mittel- und langfristige Arbeit, die von lnCor mit unserer Unterstützung durchgeführt wird. In dieser zweiten Phase besteht unsere Aufgabe darin, technischen Support bereitzustellen und herauszufinden, wie die Algorithmen effizienter auf der lnCor-Plattform ausgeführt werden können“, erklärt Andre Ribeiro.

„Bis Ende dieses Jahres sollte die Validierung abgeschlossen sein, und uns sollte der Prozess vorliegen, der die Methode zur Identifizierung von Informationen in Untersuchungen wissenschaftlich belegt“, so Gutierrez. Dabei betont er, dass sich die bisher unternommenen Anstrengungen auf Forschung und Entwicklung konzentrieren.

Die Einrichtung konzentriert sich jetzt auf den wissenschaftlichen Bereich, der bereits beeindruckende Ergebnisse geliefert hat. Derzeit führt lnCor jährlich rund 200.000 bildgebende Untersuchungen durch, wobei jede Untersuchung bis zu Tausenden von Bildern enthält. „Wir führen derzeit über Tausend Forschungsprojekte durch. Die Untergruppen dieser Studien werden sicherlich in diesen Projekten verwendet“, prognostiziert Gutierrez.

Abbildung 2: Anonymisierungsbeispiel einer Studie zum nuklearmedizinischen Bildgebungsverfahren Gated-SPECT. Textinformationen mit sensiblen Daten wurden mit einer blauen Markierung gekennzeichnet.

Darüber hinaus hat die Einrichtung 2 Millionen Bilder aller Art in ihrem System gespeichert, die Informationen von 1,4 Millionen Personen enthalten. „Durch die Anonymisierung sensibler Daten haben wir die Möglichkeit, Tausende von prädiktiven Analysen durchzuführen“, so Gutierrez.

Abbildung 3: Anonymisierungsbeispiel einer Studie im Bereich der Elektrokardiographie. Textinformationen mit sensiblen Daten wurden mit einer blauen Markierung gekennzeichnet.

Darüber hinaus sollte das System die Effizienz und Qualität des Dienstes von lnCor weiter steigern. Laut Guilherme Rabello, Commercial and Market Intelligence Manager bei lnCor, wird das System in dieser neuen Phase robuster werden. „Unser Fokus liegt auf der Entwicklung einer Lösung, die sich auf die Patientenversorgung auswirkt, um die Patientenversorgung zu verbessern und genauere Studien zu ermöglichen“, so Rabello.

„Gemeinsam erstellten wir diesen Prototyp zur Anonymisierung bildgebender Untersuchungen. Es geht nicht nur um Röntgenuntersuchungen, sondern auch um Kernspintomografien und andere Untersuchungen, die jeweils mit einem anderen Gerät von einem anderen Hersteller durchgeführt werden“. – André Ribeiro, New Business Director bei Intel Brazil.

Über das Heart Institute (InCor)

InCor wurde am 10. Januar 1977 gegründet und ist eines von sieben Instituten, die den Hospital das Clínicas-Komplex der medizinischen Fakultät der Universität von São Paulo (HCFMUSP) umfassen. Seit seiner Gründung vor 40 Jahren hat sich das Institut gemessen an der Anzahl der Besuche und der Kardiologie und Pulmonologiefachgebiete zu einem der weltweit größten Kardiologiezentren entwickelt. Jedes Jahr führt lnCor durchschnittlich 260.000 Arztbesuche, 5.000 Operationen und 2 Millionen klinische Untersuchungen durch. Das Institut hat bereits mehr als 1.000 Herz- und Lungentransplantationen durchgeführt.

PDF herunterladen ›