Forschungsbericht 2023 - Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG)
ABA – Agile Bio-inspirierte Architekturen, Teilprojekt Personalisierte Medizin & Medizintechnik
ABA – Agile Bio-inspired Architectures, subproject personalized medicine & medical technology
Interdisziplinäre Arbeitsgruppe „Translationale Molekulare Bildgebung” der UMG – Universitätsmedizin Göttingen und des MPI-NAT – Max-Planck-Institut für Multidisziplinäre Naturwissenschaften
Darmkrebs ist nach Prostata- und Lungenkrebs die dritthäufigste Krebserkrankung weltweit, von der sowohl Männer als auch Frauen betroffen sind [1]. Neben einer alternden Bevölkerung und Ernährungsgewohnheiten in Ländern mit hohem Einkommen erhöhen ungünstige Risikofaktoren wie Fettleibigkeit, Bewegungsmangel und Rauchen das Risiko, an Darmkrebs zu erkranken. Alarmierend ist die zunehmende Inzidenz bei jüngeren Patientinnen und Patienten. Zudem ist Darmkrebs die zweithäufigste Ursache krebsbedingter Todesfälle, was den dringenden Bedarf an innovativen diagnostischen Verfahren und effektiven therapeutischen Strategien unterstreicht.
Im Rahmen des ABA-Teilprojekts „Personalisierte Medizin & Medizintechnik“ arbeiten Fachleute aus Pathologie, Onkologie, Biologie, Physik, Informatik und Ethik zusammen, um neue Lösungen für die Herausforderungen bei Darmkrebs zu entwickeln. Das übergeordnete Ziel besteht darin, mithilfe künstlicher Intelligenz neue Imaging-Biomarker zu identifizieren, die es ermöglichen, Darmkrebs in Subtypen einzuteilen, um so die Behandlungsergebnisse durch eine optimierte Therapiewahl zu verbessern. Das Verbundvorhaben ABA wird vom Institut für Innovationsforschung, Technologiemanagement und Entrepreneurship (ITE) der Leibniz Universität Hannover koordiniert und umfasst drei verschiedene Industriebranchen bzw. Anwendungsbereiche. ABA stellt damit ein gutes Beispiel für die Verknüpfung von Biologisierung und Digitalisierung dar, das einen wesentlichen Beitrag zu den Grand Challenges und Sustainable Development Goals der Agenda 2030 leistet.
Bildgebung
Paraffineingebettete Gewebeproben von Darmtumoren werden vollständig mithilfe verschiedener neuer bildgebender Verfahren in 3D ungefärbt nacheinander untersucht. Diese Verfahren umfassen:
- Lichtblattmikroskopie: Ein fluoreszenzmikroskopisches Verfahren, bei dem optisch aufgeklarte Gewebestücke aufgenommen werden.
- Phasenkontrast-Computertomographie: Diese ermöglicht die dreidimensionale Erfassung anatomischer Strukturen in größeren Gewebeproben (siehe Abbildung 1).
- Multiphotonenmikroskopie: Mit ihrer gegenüber der klassischen Mikroskopie deutlich erhöhten Eindringtiefe erlaubt sie insbesondere die Darstellung von Bestandteilen der extrazellulären Matrix.
Die einzelnen Arbeitsschritte der verschiedenen Technologien sowie die Probenaufbereitung werden für diese Analysen optimiert. Dadurch werden aus demselben Gewebestück neue Informationen zu strukturellen Parametern, Verteilungsmustern und Interaktionen einzelner Zelltypen sowie zu 3D-Strukturen von Blutgefäßen und Bestandteilen der extrazellulären Matrix gewonnen. Diese Daten sollen die charakteristischen Eigenschaften und die Heterogenität der Tumorproben im Detail sichtbar machen. Ziel ist es, zu klären, ob Erkenntnisse aus diesen Verfahren als Imaging-Biomarker dienen können. Diese Biomarker könnten dann zusammen mit Daten aus Routineuntersuchungen wie Histologie, Blutwerten und molekularen Parametern genutzt werden, um Darmkrebs in weitere Untergruppen einzuteilen.
Datenanalyse
Die immense Menge an Daten ist eine der größten Herausforderungen des ABA-Projekts. Jede dreidimensional vermessene Darmkrebsprobe, die Informationen aus den drei bildgebenden Modalitäten integriert, umfasst mehr als 100 GB. Da im Laufe dieses ehrgeizigen Projekts bis 2025 etwa 1.000 Proben erfasst werden sollen, erfordert diese beträchtliche Datenmenge enorme Rechenleistung. Das GWDG-interne HPC-GPU-System (HPC = High-Performance Computing; GPU = Graphics Processing Unit) erweist sich als unschätzbare Ressource bei der Analyse dieser Daten und den damit verbundenen Anforderungen.
Ein Großteil der Rechenleistung wird für das Training eines Autoencoders (AE) zur möglichst verlustfreien Komprimierung der Datensätze verwendet (siehe Abbildung 2). Ein AE ist ein neuronales Netz (NN), das aus einem Encoder und einem Decoder besteht. Der Encoder komprimiert das Bild mithilfe von 3D-Convolutional Layers in eine kompakte Darstellung, wobei nur die wichtigsten Informationen erhalten bleiben. Der Decoder kehrt diesen Prozess um, indem er die komprimierte Darstellung als Eingabe nutzt und das Bild rekonstruiert. Eine Fehlerfunktion zwischen dem Original und dem rekonstruierten Bild wird verwendet, um das Netz iterativ mithilfe des Gradient-Descent-Verfahrens zu trainieren, sodass das Original so genau wie möglich aus der komprimierten Darstellung wiedergegeben wird.
Das Konzept des AEs basiert darauf, dass eine erfolgreiche Bildrekonstruktion aus komprimierten Daten mit minimalen Abweichungen voraussetzt, dass die markanten Merkmale des Originalbildes in den kodierten Daten erhalten bleiben. Dieses Konzept, angewandt auf die 3D-Bilder im ABA-Projekt, erleichtert deren Speicherung und Analyse, da es eine Verkleinerung um den Faktor 1.000 ermöglicht. Die kodierten Daten dienen als Grundlage für die weitere Datenanalyse-Pipeline.
Auf den kodierten Daten kann ein zweites neuronales Netz in Form eines Klassifikators trainiert werden, der lernt, ob sich der Krebs eines Patienten oder einer Patientin ausbreitet, Metastasen ausbildet oder auf bestimmte Therapien anspricht. Der Klassifikator nimmt die komprimierten Daten als Eingabe und lernt, Strukturen zu erkennen, die mit einer möglichen Metastasierung oder Ausbreitung des Krebses in Verbindung stehen. Werden dem Klassifikator neue Daten vorgelegt, analysiert er deren Merkmale auf der Grundlage dessen, was er beim Training gelernt hat, und gibt die Wahrscheinlichkeit einer Metastasierung an.
Durch den Einsatz modernster Techniken aus dem Bereich der „erklärbaren KI“ können die Gewichtungen der einzelnen Neuronen im Klassifikator und im AE genutzt werden, um die Strukturen zu lokalisieren, die beispielsweise die Metastasierung im ursprünglichen Krebsbild beeinflussen.
Unser Ziel ist es, ein tieferes Verständnis der verschiedenen strukturellen Parameter zu erlangen, die Phänomene wie Metastasierung fördern oder hemmen, und möglicherweise neue Subtypen von Darmkrebs zu identifizieren. Dieser Ansatz ermöglicht fundierte Aussagen über den potenziellen Schweregrad einer Krebserkrankung und unterstützt optimale Therapieentscheidungen. Die erfolgreiche Umsetzung eines solch innovativen und vielversprechenden Forschungsvorhabens in die Klinik, das für Patienten mit Darmkrebs von hoher Relevanz ist, ist nur innerhalb eines multidisziplinären Umfelds wie dem von ABA möglich. Optimale individuelle Therapieentscheidungen können nicht nur die Lebenszeit verlängern und die Lebensqualität verbessern, sondern auch unnötige und unwirksame Therapien sowie deren Nebenwirkungen vermeiden.
[1] https://www.lebensblicke.de/darmkrebs-hat-hohe-krankheitslast-in-deutschland/