02 Mai 2019

Tiefes Lernen zur Automatisierung der röntgenologischen Bewertung der Brust bei Mukoviszidose nach Brasfield

Die europäische CF-Gesellschaft ECFS veröffentlicht monatlich die wichtigsten News aus der Fachzeitschrift "Journal of Cystic Fibrosis" (JCF). Die Artikel sind auf die wichtigsten Fragen fokussiert und werden in verständlicher (englischer) Sprache dargestellt. Wir stellen Ihnen hier eine Übersetzung der News zur Verfügung.

Deep Learning to Automate Brasfield Chest Radiographic Scoring for Cystic Fibrosis

Autoren

Evan J. Zucker (a), Zachary A. Barnes (b), Matthew P. Lungren (a), Yekaterina Shpanskaya (a), Jayne M. Seekins (a), Safwan S. Halabi (a), David B. Larson (a)

a) Department of Radiology, Stanford University School of Medicine, 725 Welch Road, Stanford, CA 94305, USA
b) bDepartment of Computer Science, Stanford University, 353 Serra Mall, Stanford, CA 94305, USA

Was war Ihre wissenschaftliche Fragestellung?

Das Ziel dieser Studie war es, festzustellen, ob ein tiefgreifend lernendes Computermodell entwickelt werden kann, um den Schweregrad der CF-Lungenerkrankung auf Brust-Röntgenaufnahmen (CXR) mit der traditionellen Brasfield-Scoring-Methode zu messen, und ob dieses Modell ähnlich wie ein pädiatrischer Radiologe (Facharzt für medizinische Bildgebung) funktionieren kann.

Warum ist das wichtig?

Scoring-Systeme wie die Brasfield-Methode helfen, den Schweregrad der CF-Lungenerkrankung reproduzierbar und quantitativ für die Nachsorge und Behandlung zu bestimmen. Eine genaue Auswertung erfordert jedoch die Zeit und das Fachwissen von Radiologen, die knapp bemessen sind. In jüngster Zeit wurde das tiefe Lernen, eine Technik, die es Computern erlaubt, auf der Grundlage früherer Beispiele zu "lernen", erfolgreich für eine Vielzahl von Bilderkennungs- und Klassifikationsaufgaben eingesetzt, einschließlich medizinischer Anwendungen (z.B. Erkennung von Lungenentzündungen auf CXRs). Wir stellten die Hypothese auf, dass die Brasfield-Methode mit tiefem Lernen in ähnlicher Weise automatisiert werden könnte, was möglicherweise zu einem verbesserten Zugang der Patienten zu schnellen und zuverlässigen Befunden führen würde.

Wie sind Sie vorgegangen?

2.058 CF CXRs, die über zehn Jahre in unserer Einrichtung durchgeführt wurden, wurden von einem Kinder-Radiologen nach der Brasfield-Methode bewertet und dann in einen "Trainings-/Validierungssatz" von 1.858 Prüfungen und einen "Testsatz" von 200 Prüfungen unterteilt. Ein Modell für tiefes Lernen wurde schrittweise optimiert, um die Brasfield-Scores vorherzusagen, wobei nur der "Trainings-/Validierungssatz" als "Lern"-Input verwendet wurde (d.h. CXRs, die mit Scores versehen waren). Dann wurde der "Testsatz" sowohl vom Modell als auch von insgesamt fünf Kinder-Radiologen bewertet und ihre Vorhersagen verglichen. Es wurden auch "Heat Maps" erstellt, um die Teile der CXRs zu zeigen, die das Modell für die Erstellung seiner Vorhersagen als "wichtig" erachtete.

Was haben Sie herausgefunden?

Das Modell, das etwa fünf Sekunden für die Auswertung der 200 Testsatz-Untersuchungen benötigte, schnitt bei der Vorhersage der Brasfield-Scores fast so gut ab wie die Radiologen. Die durchschnittliche Differenz zwischen den Vorhersagen des Modells und den Vorhersagen der Radiologen (gemittelt) lag fast bei 0. Darüber hinaus war die Korrelation zwischen Modell und Radiologen bei der Vorhersage der Gesamtpunktzahl fast so hoch wie die Korrelation zwischen den Radiologen untereinander. Auf der Grundlage verschiedener Berechnungen erreichte oder übertraf das Modell auch die Leistung der Radiologen für 3/5 Brasfield-Merkmalen (Unterpunkte). Schließlich zeigten die Heat Maps eine visuelle Korrelation zwischen den vom Modell identifizierten auffälligen Merkmalen und dem durch die CXR ermittelten Schweregrad der Krankheit.

Was bedeutet das, und warum muss man bei der Bewertung der Ergebnisse vorsichtig sein?

Die Techniken des tiefen Lernens sind vielversprechend für die Vorhersage der Brasfield-Gesamt- und Teilergebnisse auf einem Niveau, das an den der Kinder-Radiologen heranreicht, mit schnellen Ergebnissen. Die Haupteinschränkungen der Studie betreffen die Generalisierbarkeit der CXRs, die zum Training und Testen des Modells verwendet wurden. Die Leistung des Modells würde wahrscheinlich durch den Zugang zu einer größeren Menge und Vielfalt von Trainingsdaten aus mehreren Zentren verbessert werden. Obwohl der Testsatz so gewählt wurde, dass er ein breites Spektrum der Brasfield-Schweregrad-Merkmale umfasst, könnte das Modell bei einem anderen Testsatz andere Ergebnisse zeigen (z.B. mit CXRs einer anderen Einrichtung).

Wie geht es weiter?

Die nächsten Schritte umfassen eine weitere Verfeinerung und multizentrische Validierung des Modells, das dann in einem klinischen Umfeld evaluiert werden könnte, um seinen potenziellen Nutzen zu bestimmen (z.B. schnellerer Score-Bericht). Letztendlich könnte man das Modell weit verbreiten (z.B. über eine Website), um einen breiten Zugang zu verlässlichen CF CXR-Scores zu ermöglichen.

Quellen

CF Research News Artikel

Abstract des Originalartikels

Übersetzung von Dr. Uta Düesberg, 21.02.2020