Studienziel
- Effektivitätsvergleich von KI-Modellen und menschlichen Experten bei Erstellung personalisierter Krebstherapien
Studiendesign
- Vier Large Language Models (LLMs; ChatGPT, Galactica, Perplexity, BioMedLM) entwickelten Therapiepläne für zehn fiktive Krebspatienten; Vergleich mit ärztlichem Expertenvorschlag
- Auswertung durch molekulares Tumorboard
Ergebnisse
- KI-Vorschläge insgesamt schlechter bewertet, aber einige als klinisch relevant erachtet
- BioMedLM schnitt unter den vier LLMs am schlechtesten ab
- Das Tumorboard erkannte fast immer, ob ein Vorschlag von einer KI oder einem Menschen kam, meist wegen fehlender Belege und Begründungen
Fazit
- Aktuell können KIs menschliche Experten in Tumorboards nicht ersetzen, bieten aber zukünftiges Potenzial → Weiterentwicklung und Forschung nötig









