Die akute myeloische Leukämie (AML) stellt eine aggressive Form hämatologischer Neoplasien dar, deren Management maßgeblich von der genetischen Risikostratifizierung abhängt. Genmutationen in NPM1 und FLT3-ITD zählen zu den häufigsten molekularen Aberrationen und haben sich als relevante prädiktive und therapeutische Marker etabliert. Die Mutationshäufigkeit für NPM1 liegt bei etwa 15–20 %, für FLT3-ITD bei 10–20 %; eine Koexistenz beider Mutationen wird in etwa 10,5 % der Fälle beobachtet.
Obwohl molekulargenetische Testverfahren wie PCR gängige Praxis sind, bestehen nach wie vor Zugangsbarrieren, etwa durch ungleiche Ressourcenausstattung von Laboren oder lange Analysezeiten. Eine bildbasierte Vorhersage genetischer Veränderungen könnte diesen Engpass überbrücken – insbesondere wenn sie auf bestehendem diagnostischem Material wie Knochenmarkausstrichen basiert.
Einsatz bildanalytischer Verfahren zur Erkennung molekularer Marker
Die Digitalisierung histologischer Präparate mittels Whole-Slide-Imaging (WSI) ermöglicht es, zytologische Details hochauflösend darzustellen. Derzeitige KI-gestützte Verfahren setzen dabei meist auf annotierte Patch- oder Zellebenen, was hohe Anforderungen an manuelle Vorarbeit stellt. Zudem erschwert die zelluläre Komplexität von Knochenmarkaspiraten die automatisierte Auswertung.
Vor diesem Hintergrund entwickelte eine Arbeitsgruppe des National Taiwan University Hospital ein auf Multiple Instance Learning (MIL) basierendes Deep-Learning-Modell. Das Besondere: Die Methode kommt ohne zelluläre oder patchbasierte Annotationen aus und analysiert direkt WSIs zur Prädiktion genetischer Mutationen.
KI-gestützte Analysepipeline zur Mutationserkennung in AML-Knochenmarkausstrichen
Ziel der Untersuchung war es, mithilfe künstlicher Intelligenz (KI) Mutationen in NPM1 und FLT3-ITD anhand digitalisierter Knochenmarkausstriche von AML-Patienten vorherzusagen. Grundlage bildeten 572 Whole-Slide-Images (WSIs) mit bekanntem genetischem Profil, das auf Next Generation Sequencing basierte
Die Analyse erfolgte in mehreren Schritten:
- automatische Auswahl zytologisch relevanter Bildbereiche (ROIs),
- Erkennung einzelner Leukozyten durch ein trainiertes Detektionsmodell,
- Anwendung eines zellbasierten Multiple-Instance-Learning-Modells (MIL),
- Ausgleich des Klassenungleichgewichts durch gezieltes Upsampling mutierter Fälle,
- Kombination der besten Modelle mittels ensemblebasiertem Voting einem Verfahren, bei dem die Vorhersagen mehrerer Modelle zusammengeführt werden, um die Gesamtgenauigkeit zu verbessern.
Die Modelle wurden in Trainings-, Validierungs- und Testsets aufgeteilt (400 / 56 / 116 WSIs).
Zellbasierte KI-Modelle und Ensemble-Ansätze verbessern die Vorhersageleistung deutlich
Das zellbasierte MIL-Modell in Kombination mit Upsampling und Ensemble-Techniken zeigte eine deutlich bessere Leistung als herkömmliche, patchbasierte Verfahren:
- Für NPM1-Mutationen wurde eine AUC von 0,90 ± 0,08 erreicht.
- Für FLT3-ITD lag die AUC bei 0,80 ± 0,10.
Gegenüber Modellen ohne Upsampling oder Ensemble ergab sich damit eine klare Verbesserung. Besonders deutlich zeigte sich dies bei der Reduktion falsch-positiver Ergebnisse bei einer festgelegten Sensitivität von 0,75:
- bei NPM1 sank die Rate von 0,36 auf 0,09,
- bei FLT3-ITD von 0,60 auf 0,26.
Diese Ergebnisse belegen den diagnostischen Mehrwert des kombinierten Ansatzes aus zellbasierter Analyse und Ensemblelernen.
Blasten als zentrale Zellpopulation für die Mutationsvorhersage
Die Analyse der vom Modell am höchsten bewerteten Zellen zeigte: Blasten spielten eine entscheidende Rolle bei der Vorhersage genetischer Mutationen. In mutierten Fällen war ihr Anteil unter den als relevant eingestuften Zellen deutlich erhöht – ein klarer Hinweis auf ihre besondere Bedeutung innerhalb der zytomorphologischen Muster, die das Deep-Learning-Modell erkannt hat, basierend auf der Analyse der jeweils 100 zellulären Top-Prädiktionen pro Fall.
Einfluss klinischer und genetischer Begleitvariablen auf die Modellgüte
Die Modellleistung wurde hinsichtlich begleitender Variablen wie Alter, Leukozytenzahl und weiterer Genmutationen untersucht:
- Das Vorliegen von NPM1-Mutationen beeinflusste die FLT3-ITD-Vorhersageleistung negativ.
- Hyperleukozytose (≥ 50.000/μL) minderte die Leistung des NPM1-Modells, nicht aber des FLT3-ITD-Modells.
- Alter und DNMT3A-Status hatten keinen signifikanten Einfluss auf die Modellgüte.
Diese Ergebnisse unterstreichen die Notwendigkeit differenzierter Validierung in klinisch heterogenen Subgruppen.
Fazit: Ein Schritt zu schnellerer molekularer Diagnostik bei AML
Die Studie zeigt, dass sich NPM1- und FLT3-ITD-Mutationen zuverlässig direkt aus nicht annotierten Knochenmarkausstrichen vorhersagen lassen. Der kombinierte Einsatz von Multiple Instance Learning, Ensemble-Methoden und Upsampling ermöglichte eine präzise und zugleich ressourcenschonende Analyse.
Die Methode stellt zwar noch keinen Ersatz für etablierte molekulare Testverfahren dar – insbesondere im Hinblick auf die falsch-positive Rate bei FLT3-ITD –, kann jedoch als ergänzendes Werkzeug zur Frühtriage oder für den Einsatz in ressourcenlimitierten Umgebungen dienen.
Langfristig könnte ein solches Verfahren die Zeitspanne zwischen Erstdiagnose und therapeutischer Entscheidung erheblich verkürzen und zur Individualisierung der AML-Therapie beitragen. Weitere Studien zur prospektiven Validierung und Integration weiterer molekularer Marker sind angezeigt.









