In den letzten Jahren hat künstliche Intelligenz (KI) auch in der Medizin erheblich an Bedeutung gewonnen. Insbesondere große Sprachmodelle (Large Language Models, LLMs) eröffnen neue Möglichkeiten zur Unterstützung von Diagnostik und Therapieentscheidungen. Beim Deutschen Rheumatologie Kongress 2025 stellte PD Dr. med. Johannes Knitza aktuelle Studiendaten und praxisnahe Szenarien zum Einsatz KI-gestützter Systeme in der Rheumatologie vor. Dabei standen Chancen, Grenzen und potenzielle Risiken gleichermaßen im Fokus.
Potenzial zur Beschleunigung der Versorgung
Ein zentrales Ziel KI-gestützter Systeme besteht darin, die Diskrepanz zwischen wissenschaftlicher Evidenz, Leitlinien und klinischer Versorgung zu verringern. Durch den schnelleren Transfer neuer Daten in den Praxisalltag können Patienten potenziell früher von innovativen Therapieansätzen profitieren. KI kann somit einen wichtigen Beitrag dazu leisten, den Zeitverzug zwischen Forschungsergebnissen und deren Umsetzung in die Versorgung zu verringern.
Nutzung durch Fachpersonal und Patienten
Befragungen zeigen, dass Rheumatologen LLMs derzeit vor allem für wissenschaftliches Schreiben und die Patientenkorrespondenz nutzen. Die diagnostische Unterstützung liegt mit 45 % bereits auf dem dritten Platz der Anwendungen und wird in Zukunft als das wichtigste Einsatzfeld eingeschätzt. Auch Patienten greifen zunehmend auf KI-basierte Tools zurück. Bisher nutzen sie diese überwiegend zur Information über Erkrankungen und Medikamente, während die diagnostische Unterstützung nur eine untergeordnete Rolle spielt. Perspektivisch bewerten sie Symptomchecker jedoch als besonders hilfreich, gefolgt von therapieunterstützenden Empfehlungen und Chatbots für medizinische Fragen. Bei der Frage nach der Akzeptanz des KI-Einsatzes durch Ärzte zeigte sich, dass rund 60 % dies begrüßen, knapp ein Fünftel davon sogar ausdrücklich.
Sprachmodelle mit vergleichbarer Genauigkeit zu Fachärzten
Aktuelle Studien verdeutlichen, dass LLMs in bestimmten Szenarien bereits mit erfahrenen Fachärzten vergleichbar sind. So zeigte sich in Untersuchungen zur rheumatologischen Diagnostik, dass Modelle wie ChatGPT in Bezug auf die Diagnosegenauigkeit keine signifikanten Unterschiede zu Rheumatologen aufweisen. Insbesondere bei weniger erfahrenen Kollegen kann die Verwendung von KI die diagnostische Genauigkeit deutlich erhöhen.
Somit könnten LLMs künftig vor allem bei der Vorselektion und der Unterstützung bei komplexen Differentialdiagnosen eine wichtige Rolle spielen. Im direkten Vergleich mit klassischen Medizinprodukten wie Isabel DDx oder Ada schneiden moderne LLMs zudem deutlich besser ab. Sie erreichen nicht nur eine höhere Trefferquote und liefern ihre Ergebnisse zudem schneller. Damit übertreffen LLMs etablierte Tools sowohl in Bezug auf Performance als auch auf Zeitgewinn.
Kollektive Intelligenz durch spezialisierte KI-Module
Ein weiterer Ansatz ist die Nutzung mehrerer spezialisierter „Agenten“ (KI-Module mit spezifischen Aufgaben), die unterschiedliche Datenquellen wie Anamnese, Bildgebung oder Laborergebnisse verarbeiten und ihre Ergebnisse zusammenführen. Diese Form der kollektiven Intelligenz könnte die Genauigkeit weiter erhöhen. Erste Daten zeigen zudem, dass moderne LLMs bereits eine bessere Leistung und kürzere Bearbeitungszeiten als klassische Medizinprodukte aufweisen.
Sicherheit als zentrales Kriterium für den Einsatz
Ein zentrales Thema ist die Sicherheit im praktischen Einsatz. Verfahren wie die Retrieval-Augmented Generation (RAG) können die Verlässlichkeit der Antworten erhöhen, indem sie auf validierte Wissensbasen zurückgreifen. Zusätzlich entstehen spezialisierte Tools. Mit OpenEvidence steht ein frei zugängliches System zur Verfügung, das Antworten direkt mit Literaturquellen verknüpft. Mit Prof. Valmed wurde zudem das erste LLM-basierte Medizinprodukt vorgestellt, das auf geprüften Leitlinien und Fachinformationen basiert. Diese Entwicklungen verdeutlichen die Dynamik des Feldes, machen aber zugleich regulatorische Fragen und klare Qualitätsstandards erforderlich.
Risiken des KI-Einsatzes in der klinischen Praxis
Neben den Chancen betonte Dr. Knitza auch die Risiken. Dazu zählen ein möglicher „Automation Bias“, also die unkritische Übernahme von KI-Vorschlägen, sowie das Risiko des Deskillings, bei dem ärztliche Kernkompetenzen durch eine zu starke Automatisierung verloren gehen. Auch der Verlust des situativen Überblicks („Loss of Situational Awareness“) kann zu Fehlentscheidungen führen. Für den klinischen Alltag bedeutet dies, dass KI stets als Ergänzung und niemals als Ersatz für ärztliche Expertise verstanden werden sollte.
KI als Ergänzung, nicht als Ersatz ärztlicher Expertise
KI-basierte Diagnose- und Vorselektionsmodelle entwickeln sich rasant und zeigen bereits eine mit Fachärzten vergleichbare Leistungsfähigkeit, vor allem zur Unterstützung weniger erfahrener Kollegen. Für eine sichere Integration in den klinischen Alltag sind jedoch klare Regelungen und ärztliche Verantwortung entscheidend. Richtig eingesetzt können KI-Systeme die Versorgung beschleunigen und die Behandlung von Patienten effizienter und sicherer machen.









