KI-gestützte Sprachanalyse verbessert Früherkennung von Parkinson-Krankheit

KI-gestützte Sprachanalyse über Smart-Home-Geräte wie Amazon Alexa oder Google Home könnte die Parkinson-Früherkennung in Klinik und häuslicher Umgebung erleichtern. Eine US-Studie erreichte anhand zweier kurzer Sätze eine Genauigkeit von etwa 86 %.

Sprachanalyse

Parkinson gilt weltweit als die neurologische Erkrankung mit der schnellsten Zunahme hinsichtlich Prävalenz, Krankheitslast (DALYs) und Sterblichkeit. Allein in den USA verursachte Parkinson im Jahr 2017 Kosten von rund 52 Milliarden USD; bis 2030 wird ein Anstieg auf über 79 Milliarden USD erwartet. Eine frühzeitige Diagnose und kontinuierliche Verlaufsbeobachtung sind entscheidend, um Therapieergebnisse zu verbessern und die Belastung des Gesundheitssystems zu reduzieren.

Sprachstörungen treten bei bis zu 89 % der Patienten auf und stellen einen einfach erfassbaren, potenziell diagnostisch relevanten Marker für die Früherkennung dar. Genau hier setzt eine aktuelle Studie der University of Rochester (USA) an.

KI-Modell zur Analyse kurzer Sprachproben

Das Forschungsteam entwickelte und validierte ein KI-basiertes Screeningverfahren, das anhand kurzer Sprachproben Parkinson-spezifische Auffälligkeiten erkennt. Untersucht wurde, ob ein neuartiges Fusionsmodell semi-überwachter Sprach-Embeddings die diagnostische Genauigkeit im Vergleich zu bisherigen Verfahren erhöhen kann.

Für die in der Fachzeitschrift 'npj Parkinson’s Disease' veröffentlichten Studie wurden Sprachaufnahmen von 1.306 Teilnehmenden (davon 392 mit Parkinson) in klinischen und häuslichen Umgebungen erhoben. Die Teilnehmenden sprachen zwei englische Pangramme, die alle Buchstaben des Alphabets enthalten. Die Analyse nutzte Sprachrepräsentationen aus Wav2Vec 2.0, WavLM und ImageBind. Diese wurden im vorgestellten projektionsbasierten Fusionsmodell zu einem gemeinsamen Merkmalsraum kombiniert. Die Auswertung erfolgte in einem stratifizierten, randomisierten Split; externe Validierungen wurden an unabhängigen klinischen Datensätzen durchgeführt.

Hohe Genauigkeit und robuste Leistung

Das projektionsbasierte Fusionsmodell erreichte in der internen Validierung eine Fläche unter der ROC-Kurve (AUC) von 88,9 % bei einer Genauigkeit von 85,7 %. In externen Tests lagen die AUC-Werte bei 82,1 % bzw. 78,4 % und die Genauigkeiten bei 74,7 % bzw. 70,2 %.

Die statistische Analyse zeigte keine signifikanten Leistungsunterschiede zwischen Geschlechtern, Altersgruppen oder ethnischen Populationen. Auffällig war jedoch, dass Männer im Alter von 51–72 Jahren und Frauen über 72 Jahren häufiger falsch klassifiziert wurden. Dieser Befund stimmt mit bekannten altersabhängigen Veränderungen der Stimmphysiologie überein.

Vergleich mit ärztlicher Diagnostik

Laut Literatur liegt die Genauigkeit nicht-spezialisierter Kliniker bei der Parkinson-Erkennung bei 73,8 %, während Bewegungsspezialisten 79,6 % erreichen. Das KI-Modell erreichte mit 85,7 % deutlich höhere Werte, wenngleich direkte Vergleiche aufgrund unterschiedlicher Studienpopulationen nur eingeschränkt möglich sind.

Fazit: Technik mit Entwicklungspotenzial

Die Ergebnisse zeigen, dass eine KI-gestützte Sprachanalyse Parkinson anhand kurzer Sprachproben mit hoher Genauigkeit erkennen kann. Die Kombination mehrerer Sprach-Embeddings in einem projektionsbasierten Fusionsmodell erwies sich als überlegen gegenüber der einfachen Merkmal-Konkatenation. Ehsan Hoque, Professor an der University of Rochester, erklärt: „Mit Zustimmung der Nutzer könnten weit verbreitete sprachbasierte Schnittstellen wie Amazon Alexa oder Google Home möglicherweise helfen, Personen zu identifizieren, die eine weiterführende medizinische Abklärung benötigen.“

Weitere Studien sollten den Ansatz auf andere Sprachen, größere und diversere Populationen sowie multimodale Eingangsdaten ausweiten, um das volle Potenzial dieser Technologie für die klinische Praxis zu erschließen.

Autor:
Stand:
11.09.2025
Quelle:

Adnan, T. et al. (2025): A novel fusion architecture for detecting Parkinson’s Disease using semi-supervised speech embeddings. npj Parkinson’s Disease, DOI: 10.1038/s41531-025-00956-7

  • Teilen
  • Teilen
  • Teilen
  • Drucken
  • Senden