Forschungsbericht 2023 - Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG)

ABA – Agile Bio-inspirierte Architekturen, Teilprojekt Personalisierte Medizin & Medizintechnik 

ABA – Agile Bio-inspired Architectures, subproject personalized medicine & medical technology 

Autoren
Friedrich, Lukas; Alves, Frauke; Wieder, Philipp
Abteilungen
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) – Arbeitsgruppe „eScience“

Interdisziplinäre Arbeitsgruppe „Translationale Molekulare Bildgebung” der UMG – Universitätsmedizin Göttingen und des MPI-NAT – Max-Planck-Institut für Multidisziplinäre Naturwissenschaften
 
Zusammenfassung
Das interdisziplinäre und medizinische Teilprojekt von ABA, gefördert von der VolkswagenStiftung, bringt Experten aus verschiedenen Bereichen in der Darmkrebsforschung zusammen, um Patienten für eine optimale Therapiewahl zu stratifizieren. Proben von Darmtumoren werden an der Universitätsmedizin Göttingen (UMG) und am Max-Planck-Institut für Multidisziplinäre Naturwissenschaften (MPI-NAT) mithilfe bildgebender 3D-Methoden untersucht und in einem Data Lake der GWDG gespeichert. Die Daten werden auf dem Hochleistungsrechner Emmy der GWDG mittels KI komprimiert und analysiert.
 
Summary
The interdisciplinary and medical sub-project of ABA, funded by the Volkswagen Foundation, brings together experts from various fields for colon cancer research in order to stratify patients for an optimal choice of therapy. Samples of intestinal tumors are examined in 3D using imaging methods at the University Medical Center Göttingen (UMG) and the Max Planck Institute for Multidisciplinary Natural Sciences (MPI-NAT) and stored in a data lake at the GWDG. The data is compressed and analysed using AI on the high-performance computer Emmy operated by the GWDG.
 

Darmkrebs ist nach Prostata- und Lungenkrebs die dritthäufigste Krebserkrankung weltweit, von der sowohl Männer als auch Frauen betroffen sind [1]. Neben einer alternden Bevölkerung und Ernährungsgewohnheiten in Ländern mit hohem Einkommen erhöhen ungünstige Risikofaktoren wie Fettleibigkeit, Bewegungsmangel und Rauchen das Risiko, an Darmkrebs zu erkranken. Alarmierend ist die zunehmende Inzidenz bei jüngeren Patientinnen und Patienten. Zudem ist Darmkrebs die zweithäufigste Ursache krebsbedingter Todesfälle, was den dringenden Bedarf an innovativen diagnostischen Verfahren und effektiven therapeutischen Strategien unterstreicht.

Im Rahmen des ABA-Teilprojekts „Personalisierte Medizin & Medizintechnik“ arbeiten Fachleute aus Pathologie, Onkologie, Biologie, Physik, Informatik und Ethik zusammen, um neue Lösungen für die Herausforderungen bei Darmkrebs zu entwickeln. Das übergeordnete Ziel besteht darin, mithilfe künstlicher Intelligenz neue Imaging-Biomarker zu identifizieren, die es ermöglichen, Darmkrebs in Subtypen einzuteilen, um so die Behandlungsergebnisse durch eine optimierte Therapiewahl zu verbessern. Das Verbundvorhaben ABA wird vom Institut für Innovationsforschung, Technologiemanagement und Entrepreneurship (ITE) der Leibniz Universität Hannover koordiniert und umfasst drei verschiedene Industriebranchen bzw. Anwendungsbereiche. ABA stellt damit ein gutes Beispiel für die Verknüpfung von Biologisierung und Digitalisierung dar, das einen wesentlichen Beitrag zu den Grand Challenges und Sustainable Development Goals der Agenda 2030 leistet.

Bildgebung

Paraffineingebettete Gewebeproben von Darmtumoren werden vollständig mithilfe verschiedener neuer bildgebender Verfahren in 3D ungefärbt nacheinander untersucht. Diese Verfahren umfassen:

  1. Lichtblattmikroskopie: Ein fluoreszenzmikroskopisches Verfahren, bei dem optisch aufgeklarte Gewebestücke aufgenommen werden.
  2. Phasenkontrast-Computertomographie: Diese ermöglicht die dreidimensionale Erfassung anatomischer Strukturen in größeren Gewebeproben (siehe Abbildung 1).
  3. Multiphotonenmikroskopie: Mit ihrer gegenüber der klassischen Mikroskopie deutlich erhöhten Eindringtiefe erlaubt sie insbesondere die Darstellung von Bestandteilen der extrazellulären Matrix.

Die einzelnen Arbeitsschritte der verschiedenen Technologien sowie die Probenaufbereitung werden für diese Analysen optimiert. Dadurch werden aus demselben Gewebestück neue Informationen zu strukturellen Parametern, Verteilungsmustern und Interaktionen einzelner Zelltypen sowie zu 3D-Strukturen von Blutgefäßen und Bestandteilen der extrazellulären Matrix gewonnen. Diese Daten sollen die charakteristischen Eigenschaften und die Heterogenität der Tumorproben im Detail sichtbar machen. Ziel ist es, zu klären, ob Erkenntnisse aus diesen Verfahren als Imaging-Biomarker dienen können. Diese Biomarker könnten dann zusammen mit Daten aus Routineuntersuchungen wie Histologie, Blutwerten und molekularen Parametern genutzt werden, um Darmkrebs in weitere Untergruppen einzuteilen.

Datenanalyse

Die immense Menge an Daten ist eine der größten Herausforderungen des ABA-Projekts. Jede dreidimensional vermessene Darmkrebsprobe, die Informationen aus den drei bildgebenden Modalitäten integriert, umfasst mehr als 100 GB. Da im Laufe dieses ehrgeizigen Projekts bis 2025 etwa 1.000 Proben erfasst werden sollen, erfordert diese beträchtliche Datenmenge enorme Rechenleistung. Das GWDG-interne HPC-GPU-System (HPC = High-Performance Computing; GPU = Graphics Processing Unit) erweist sich als unschätzbare Ressource bei der Analyse dieser Daten und den damit verbundenen Anforderungen.

Ein Großteil der Rechenleistung wird für das Training eines Autoencoders (AE) zur möglichst verlustfreien Komprimierung der Datensätze verwendet (siehe Abbildung 2). Ein AE ist ein neuronales Netz (NN), das aus einem Encoder und einem Decoder besteht. Der Encoder komprimiert das Bild mithilfe von 3D-Convolutional Layers in eine kompakte Darstellung, wobei nur die wichtigsten Informationen erhalten bleiben. Der Decoder kehrt diesen Prozess um, indem er die komprimierte Darstellung als Eingabe nutzt und das Bild rekonstruiert. Eine Fehlerfunktion zwischen dem Original und dem rekonstruierten Bild wird verwendet, um das Netz iterativ mithilfe des Gradient-Descent-Verfahrens zu trainieren, sodass das Original so genau wie möglich aus der komprimierten Darstellung wiedergegeben wird.

Das Konzept des AEs basiert darauf, dass eine erfolgreiche Bildrekonstruktion aus komprimierten Daten mit minimalen Abweichungen voraussetzt, dass die markanten Merkmale des Originalbildes in den kodierten Daten erhalten bleiben. Dieses Konzept, angewandt auf die 3D-Bilder im ABA-Projekt, erleichtert deren Speicherung und Analyse, da es eine Verkleinerung um den Faktor 1.000 ermöglicht. Die kodierten Daten dienen als Grundlage für die weitere Datenanalyse-Pipeline.

Auf den kodierten Daten kann ein zweites neuronales Netz in Form eines Klassifikators trainiert werden, der lernt, ob sich der Krebs eines Patienten oder einer Patientin ausbreitet, Metastasen ausbildet oder auf bestimmte Therapien anspricht. Der Klassifikator nimmt die komprimierten Daten als Eingabe und lernt, Strukturen zu erkennen, die mit einer möglichen Metastasierung oder Ausbreitung des Krebses in Verbindung stehen. Werden dem Klassifikator neue Daten vorgelegt, analysiert er deren Merkmale auf der Grundlage dessen, was er beim Training gelernt hat, und gibt die Wahrscheinlichkeit einer Metastasierung an.

Durch den Einsatz modernster Techniken aus dem Bereich der „erklärbaren KI“ können die Gewichtungen der einzelnen Neuronen im Klassifikator und im AE genutzt werden, um die Strukturen zu lokalisieren, die beispielsweise die Metastasierung im ursprünglichen Krebsbild beeinflussen.

Unser Ziel ist es, ein tieferes Verständnis der verschiedenen strukturellen Parameter zu erlangen, die Phänomene wie Metastasierung fördern oder hemmen, und möglicherweise neue Subtypen von Darmkrebs zu identifizieren. Dieser Ansatz ermöglicht fundierte Aussagen über den potenziellen Schweregrad einer Krebserkrankung und unterstützt optimale Therapieentscheidungen. Die erfolgreiche Umsetzung eines solch innovativen und vielversprechenden Forschungsvorhabens in die Klinik, das für Patienten mit Darmkrebs von hoher Relevanz ist, ist nur innerhalb eines multidisziplinären Umfelds wie dem von ABA möglich. Optimale individuelle Therapieentscheidungen können nicht nur die Lebenszeit verlängern und die Lebensqualität verbessern, sondern auch unnötige und unwirksame Therapien sowie deren Nebenwirkungen vermeiden.

[1] https://www.lebensblicke.de/darmkrebs-hat-hohe-krankheitslast-in-deutschland/

Esc