Diabetische Retinopathie: KI-gestützte Analyse verbessert Screening

Acht getestete KI-Bildanalysesysteme erreichten bei behandlungsbedürftiger diabetischer Retinopathie eine Genauigkeit von bis zu 99,8 % und damit ein Niveau, das mit der manuellen Befundung vergleichbar war oder diese übertraf.

Auge-Untersuchung-Retina

Die globale Zunahme von Diabetes mellitus führt seit Jahren zu einem deutlichen Anstieg der diabetischen Retinopathie, einer der häufigsten Ursachen vermeidbarer Erblindung weltweit. Nationale Screeningprogramme spielen hierbei eine zentrale Rolle, doch die wachsende Zahl zu analysierender Fundusaufnahmen stellt Gesundheitsdienste vor erhebliche Herausforderungen. Allein im englischen NHS-Diabetic Eye Screening Programme werden jährlich Millionen retinaler Bilder erhoben und durch geschulte menschliche Befunder beurteilt – ein ressourcenintensiver Prozess, der zunehmend an Kapazitätsgrenzen stößt.

Vor diesem Hintergrund rückt der Einsatz automatisierter retinaler Bildanalysesysteme (Automated Retinal Image Analysis Systems, ARIAS) in den Fokus. Sie versprechen eine schnellere Befundung, standardisierte Auswertung und potenzielle Entlastung der Screeningstrukturen. Entscheidend ist jedoch ihre belastbare Leistungsfähigkeit unter realen Versorgungsbedingungen.

Analyse von 1,2 Millionen Fundusaufnahmen

Eine in 'The Lancet Digital Health' publizierte englische Untersuchung stellt die bisher größte offene, anbieterunabhängige Direktvergleichs-Evaluation von ARIAS dar. Analysiert wurden rund 1,2 Millionen Fundusaufnahmen aus 202.886 Screeningbesuchen des North East London Diabetic Eye Screening Programme (Zeitraum: 1. Januar 2021 bis 31. Dezember 2022). Die finalen manuellen Bewertungen durch bis zu drei menschliche Befunder dienten als Referenzstandard.

Bewertet wurden acht CE-gekennzeichnete, kommerzielle ARIAS. Ziel war die Beurteilung der Sensitivität für überweisungsrelevante diabetische Retinopathien, einschließlich moderat-schwerer nicht-proliferativer (R2) und proliferativer Retinopathie (R3), sowie die Analyse der Leistungsstabilität über Alters-, Geschlechts-, Ethnizitäts- und Deprivationssubgruppen hinweg.

Methodenbasierte Bewertung mehrerer KI-Systeme im identischen Umfeld

Alle acht ARIAS wurden in einer neutralen, technisch einheitlichen Forschungsumgebung betrieben, ohne Zugang zu menschlichen Befundungsdaten. Die Bildauswertung erfolgte ausschließlich anhand der vorhandenen retinalen Aufnahmen. Untersucht wurde die diagnostische Leistung für:

  • überweisungsrelevante diabetische Retinopathie (Primärendpunkt)
  • moderate bis schwere nicht-proliferative diabetische Retinopathie
  • proliferative diabetische Retinopathie
  • milde bis moderate nicht-proliferative Retinopathie mit überweisungsrelevanter Makulopathie (R1M1)

Dabei wurden nicht nur Gesamtwerte, sondern auch populationsspezifische Unterschiede analysiert.

Hohe Sensitivität für mittel- und hochgradige Retinopathiestufen

Die ARIAS erzielten eine Sensitivität von 83,7–98,7 % für überweisungsrelevante diabetische Retinopathie. Für moderate bis schwere nicht-proliferative Formen lag die Sensitivität bei 96,7–99,8 %, für proliferative Retinopathie bei 95,8–99,5 %. Mehrere Systeme erreichten damit das aktuelle Qualitätsniveau geschulter menschlicher Befunder im NHS-Screening oder übertrafen es.

Für milde bis moderate Retinopathie mit überweisungsrelevanter Makulopathie (R1M1) zeigte sich eine größere Spannbreite (79,5–98,3 %). Die größten Leistungsvariationen traten in dieser Subgruppe auf – einem Bereich, in dem auch unter Humanbefundern eine bekannte Variabilität dokumentiert ist.

Ein weiterer Aspekt betrifft die Rate falsch-positiver Ergebnisse bei unauffälligen Befunden: Diese variierte zwischen 4,3 % und 61,4 %. Innerhalb einzelner Systeme zeigten sich Unterschiede von bis zu 44 Prozentpunkten zwischen Bevölkerungsgruppen. Dennoch blieb die Sensitivität für moderate bis schwere nicht-proliferative und proliferative Retinopathie über alle Subgruppen hinweg stabil.

Konstante Leistung über Subgruppen hinweg

Die Analyse zeigte eine weitgehend konsistente Sensitivität über ethnische Gruppen, Geschlechter und Deprivationsquintile hinweg, insbesondere für moderate und schwere Retinopathiegrade. Ein Leistungsabfall wurde nur in der ältesten Altersgruppe festgestellt, den die Autoren auf typische Bildqualitätsprobleme wie Katarakt oder kleine Pupillen zurückführen. Dies betraf jedoch sowohl ARIAS als auch menschliche Befunder.

Fazit: KI-basierte Ersttriage entlastet das Screening deutlich

Basierend auf den Leistungsdaten könnte der Einsatz von ARIAS als Ersttriage die Notwendigkeit eines primären menschlichen Gradings um 26–77 % reduzieren, so die Autoren. In der Diskussion der Arbeitsgruppe wird ein mögliches Reduktionspotenzial von bis zu 80 % genannt. Die Untersuchung zeigte zudem, dass bei Patienten mit gutem Visus weniger als 0,5 % der Fälle mit überweisungsrelevanter diabetischer Retinopathie übersehen wurden.

Diese Ergebnisse unterstreichen das Potenzial der ARIAS-gestützten Triage, die Belastung hoher Bildvolumina zu verringern und gleichzeitig die Erkennungsrate für klinisch relevante Befunde aufrechtzuerhalten.

Autor:
Stand:
16.12.2025
Quelle:

Rudnicka, A. R., et al. (2025): Automated retinal image analysis systems to triage for grading of diabetic retinopathy: a large-scale, open-label, national screening programme in England. The Lancet Digital Health, DOI: 10.1016/j.landig.2025.100914.

  • Teilen
  • Teilen
  • Teilen
  • Drucken
  • Senden
Orphan Disease Finder
Orphan Disease Finder

Hier können Sie seltene Erkrankungen nach Symptomen suchen: