„Wenn eine Serverfarm uns nicht ersetzen soll, sollten wir uns mehr um die Patienten kümmern!“

Für eine Studie baten britische Wissenschaftler 26 Radiologen, die ihre Facharztprüfungen des Royal College of Radiologists in London kürzlich bestanden hatten, in einem Test-Examen gegen Künstliche Intelligenz (KI) anzutreten. Das Ergebnis: Die Radiologen waren zwar besser als die KI, aber der Abstand der KI war nur noch gering. Eine Spielerei? Prof. Dr. Stephan Schmitz, Facharzt für Radiologie in einer BAG in Aschaffenburg und Mitglied der Radiologie Initiative Bayern, hat sich mit der Studie und der Rolle von KI innerhalb der Radiologie auseinandergesetzt. Er ordnet das Probeexamen im Gespräch mit Ursula Katthöfer (textwiese.com) ein und wirft einen Blick auf die Zukunft der Radiologie.

Redaktion: Wie bewerten Sie die Studie des Royal College?

Prof. Schmitz: Das ist eine durchaus ernst zu nehmende Studie. Das Royal College of Radiologists ist mit einer Fachgesellschaft vergleichbar. Es wurden Standardfragen zu konventionellen Röntgenbildern gestellt, nicht-interpretierbare Bilder waren ausgeschlossen worden. Bei einer Genauigkeitsquote von 90 Prozent galt die Prüfung als bestanden. Die Radiologen erreichten im Durchschnitt eine Richtigkeit von 84,8 Prozent und bestanden vier der zehn Prüfungen. KI schaffte 79,5 Prozent Richtigkeit. Das reichte für das Bestehen von zwei der zehn Prüfungen.

Frage: Warum nehmen Sie dieses Ergebnis so ernst?

Prof. Schmitz: Zum einen, da hier nicht irgendeine Labor-KI geprüft wurde, sondern ein in Europa zugelassenes Medizinprodukt, das also jetzt schon klinisch einsetzbar ist. Zum anderen, weil das Studiendesign recht gut war. Es konnten 26 Radiologen als human-reader für die Studie gewonnen werden.

Redaktion: Wo sehen Sie die Schwächen?

Prof. Schmitz: Das sind die üblichen Begrenzungen der KI: Die KI ist ein One-Trick-Pony, d. h., sie kann in der Regel nur eine einzige binäre Frage mit einer Wahrscheinlichkeit zwischen 0 und 1 beantworten. In der aktuellen Studie wurden immerhin sieben klinische Fragestellungen beantwortet: Bei den Knochen waren das Fragen zu Fraktur, Gelenkerguss oder Luxation, bei den Lungen waren es vier weitere Fragen. Für andere Fragestellungen war der KI-Kandidat nicht trainiert worden, also ahnungslos. Aber die KI der französischen Firma SmartUrgences soll auch primär für die Notfalldiagnostik eingesetzt werden.

Redaktion: Wie dicht ist KI den menschlichen Radiologen auf den Fersen?

Prof. Schmitz: Wenn wir die Entwicklungsdynamik der KI in die Zukunft projizieren, dann könnte der britisch-kanadische Informatiker und Kognitionspsychologe Geoffrey Hinten damit recht haben, dass KI in der Zukunft viele Aufgaben übernimmt. Hinten hat sich nur mit dem Zeitpunkt vertan, als er 2016 meinte, es sei in fünf Jahren so weit. Die medizinische Welt ist sehr viel komplexer als von KI-Forschern angenommen. Natürlich muss sie auch als Medizinprodukt getestet werden, das kostet Zeit. Um ihre Qualität zu beurteilen, brauchen wir sehr gute Methoden. Es muss Regelwerke geben.

Redaktion: Bisher sprechen wir nur über die konventionelle Radiologie. Wie steht es um CT und MR?

Prof. Schmitz: Da geht es um spezialisierte Fragen. Mithilfe der CT Metastasen in der Lunge zu befunden, funktioniert mit KI schon seit einigen Jahren ganz gut. Auch das Hirnvolumen lässt sich z. B. bei Patienten mit Erkrankungen wie Alzheimer, Demenz und MS gut berechnen. Denn KI ist dem menschlichen Auge darin überlegen, diskrete subtile Veränderungen zu quantifizieren. Das Auge hingegen kann Bildinhalte in komplexen Bildern gut erkennen.

Redaktion: Machen Radiologen, die zur KI forschen, ihre eigene Zunft überflüssig?

Prof. Schmitz: Das kann man so sehen, aber das ist nicht die Frage. Denn es geht um bessere Diagnostik. Wir wollen ja eine höhere Qualität erreichen. Auch bin ich ganz entspannt, weil der Bedarf an Bildgebung angesichts der Demographie enorm steigt. Menschen überleben viele Tumorerkrankungen und haben komplizierte Anamnesen. Die Datensätze alter Menschen sind sehr komplex. Wir müssen Veränderungen bewerten, die bei KI zu Fehldiagnosen führen könnten.

Dennoch wird unser Berufsbild sich ändern, wenn die Aufgabe vor allem darin besteht, vorproduzierte Ergebnisse der KI zu bewerten und z. B. falsch-positive Befunde auszusortieren und die richtigen übrig zu lassen.

Redaktion: Die radiologische Forschung beschäftigt sich ja seit Jahren mit der KI. Warum ist der große Umbruch, die Disruption, bisher ausgeblieben? Wo ist das Chat-GPT der Radiologie?

Prof. Schmitz: Die radiologische Forschung ist tatsächlich sehr auf KI fokussiert und es gibt stetige Fortschritte. Google und Chat-GPT sind sprachbasierte Systeme, die immer eine Antwort aus anderen Texten ableiten können. Chat-GPT kann sogar schöne radiologische Befunde schreiben, allerdings ohne jemals ein Bild gesehen zu haben. In der Radiologie geht es um bildbasierte KI, die jeweils nur eine oder eine Auswahl von klinischen Fragestellungen beantworten kann. Die Schwierigkeit in der Radiologie ist es daher nicht, irgendeine Antwort zu geben, sondern für jeden Patienten individuell die richtigen Fragen zu stellen. Um diesen Ansatz zu verfolgen, habe ich vor zwei Jahren das Start-up Raiys mit nun acht Mitarbeitenden gegründet. Es geht uns aber nicht um die Bildinterpretation, sondern wir konzentrieren uns auf die Befundgenerierung. Die Software soll die richtige KI anstoßen und medizinische Bild- und Textdaten, die aus Untersuchungen, Arztbriefen oder Patientengesprächen stammen, zu einem Befund zusammenfassen. Kurz, sie soll Radiologen helfen, die wachsenden Datenmengen zu bewältigen und unseren Patienten besser zu helfen.

Redaktion: Womit wir bei den Patienten wären. Wo bleiben die, wenn Radiologen sich nicht mal mehr mit Bildern, sondern nur mit daraus abgeleiteten Daten befassen?

Prof. Schmitz: Die Pandemie hat vieles verändert. Viele Radiologen haben nun eine größere Distanz zu den Patienten, manche sprechen kaum noch mit ihnen. Doch der Dialog verbessert die Befunde und den medizinischen Nutzen, den die Patienten und behandelnden Ärzte aus unseren Untersuchungen ziehen. Wenn wir als Radiologen nicht von einer Serverfarm ersetzt werden wollen, müssen wir uns dringend wieder mehr um unsere Patienten kümmern. Wir müssen sie in den Mittelpunkt rücken, um besser zu befunden.

Redaktion: Wie kann das gehen?

Prof. Schmitz: Noch gehen die Angaben eines Patienten zu seinen Beschwerden und Vorerkrankungen zu oft verloren. Auch zum Versorgungsansatz fehlen Erkenntnisse. Wie bewerten uns z. B. die Überweiser? Sind sie mit unseren Befunden zufrieden? Wir haben in der Radiologie sehr viel technische Qualitätssicherung. Aber zur Qualität des Informationsflusses wissen wir noch zu wenig. Dort müssen wir ansetzen und fragen, ob der wichtige Beitrag unserer Bilder überhaupt richtig ankommt.

Redaktion: Könnte KI irgendwann an ihre Grenzen stoßen?

Prof. Schmitz: Das ist eine spannende Frage. Noch können wir die Grenzen nicht absehen, denn die KI entwickelt sich noch. KI-Lösungen einzubinden ist noch kompliziert, es entstehen Konflikte. Manche Radiologen sagen, dass sie KI nicht brauchen. Kleine Praxen können die notwendigen IT-Teams nicht stemmen. Zudem existieren in Deutschland noch zu große Vorbehalte gegen Cloud-Lösungen. Bevor wir die Grenzen der KI einschätzen können, muss sie erst einmal Akzeptanz gewinnen. Sie muss sich als eine Hilfe bewähren. Es kann sein, dass Radiologen irgendwann so viele Bilder haben, dass KI für sie zur willkommenen Entlastung wird.

Redaktion: Welche Rolle spielt die Haftungsfrage?

Prof. Schmitz: Die medico-legalen Aspekte müssen berücksichtigt werden. Der Radiologe haftet, wenn KI Fehler macht. Deshalb muss er sich fragen, in welchem Fall KI sinnvoll ist. Es kann natürlich in Zukunft sein, dass KI so smart wird, dass sie den Großteil des Befundungsprozesses übernimmt. Doch beim autonomen Fahren in der Radiologie sind wir noch lange nicht.

Redaktion: Bleibt die Frage der Vergütung.

Prof. Schmitz: KI ist relativ teuer. Bei gesetzlich versicherten Patienten haben wir ein bisher nicht gelöstes wirtschaftliches Problem. Nicht einmal die privaten Krankenversicherungen haben Abrechnungsziffern für KI. Dabei bietet KI einen Mehrwert, wenn z. B. der Tumor eines Patienten genau bestimmt werden kann. Dennoch wird in der breiten Versorgung immer noch das Zentimetermaß benutzt. Bei MS-Patienten misst KI das genaue Volumen der Läsionen in einer Volumeneinheit, die dem menschlichen Auge möglicherweise entgeht. Fehlschlüsse können dazu führen, dass der Patient ein nicht mehr wirksames Präparat einnimmt, obwohl ein anderes verordnet werden müsste. Da werden 100 Euro gespart, obwohl die Kosten dafür in die Tausende gehen. Das ist unverhältnismäßig. Unsere Gesellschaft bzw. die Politik hat noch nicht ausreichend erkannt, dass wir eine Quantifizierung von Befunden brauchen.

Quelle

  • Shelmerdine SC et al.: Can artificial intelligence pass the Fellowship of the Royal College of Radiologists examination? Multi-reader diagnostic accuracy study. BMJ. 2022 Dec 21; 379:e072826. doi.org/10.1136/bmj-2022-072826.