HOBART (Biermann) – Eine aktuelle Studie zeigt eine hohe Wirksamkeit bei der Unterscheidung zwischen glaukomatösen und gesunden Papillen für ein auf Computer Vision basierendes Modell zur Glaukom-Früherkennung anhand von Fundusbildern.
Die Wissenschaftler sammelten Glaukom-Fundusdaten aus 20 öffentlich zugänglichen Datenbanken weltweit. Insgesamt wurden 18.468 Bilder aus verschiedenen klinischen Bereichen gesammelt und klassifiziert (gesund = 10.900 und Glaukom = 7568). Alle Daten wurden ausgewertet und so verkleinert, dass sie den Eingabeanforderungen des Modells entsprachen. Das potenzielle Modell wurde aus 20 vortrainierten Modellen ausgewählt und auf dem gesamten Datensatz mit Ausnahme von Drishti-GS trainiert. Um gesunde und glaukomatöse Fundusbilder zu klassifizieren, wurde das leistungsstärkste Modell mithilfe der Bibliotheken Fastai und PyTorch weiter trainiert. Die Leistung des Modells wurde anhand der Fläche unter der Empfängerkennlinie (AUROC), der Sensitivität, Spezifität, Genauigkeit, Präzision und des F1-Scores mit der tatsächlichen Klasse verglichen. Die hohe Unterscheidungsfähigkeit des besten Modells wurde anhand eines Datensatzes mit 1364 glaukomatösen und 2047 gesunden Papillen bewertet.
Die Wissenschaftler ermittelten für das Modell robuste Leistungskennzahlen mit einem AUROC von 0,9920 (95% CI: 0,9920–0,9921) sowohl für die Glaukom- als auch für die gesunde Klasse. Sensitivität, Spezifität, Genauigkeit, Präzision, Recall und F1-Werte lagen für beide Klassen durchweg über 0,9530. Zudem schnitt das Modell in einem externen Validierungsset des Drishti-GS-Datensatzes mit einem AUROC von 0,8751 und einer Genauigkeit von 0,8713 gut ab.
Als das Modell mit ungesehenen Daten ausgewertet wurde, nahm die Genauigkeit leicht ab, was laut der Autoren auf mögliche Unstimmigkeiten zwischen den Datensätzen hindeutet. Deshalb empfehlen sie, dass Modell zu verfeinern und an größeren, vielfältigeren Datensätzen zu validieren, um Zuverlässigkeit und Verallgemeinerbarkeit zu gewährleisten. Dennoch kann das Modell für das Glaukom-Screening auf Bevölkerungsebene verwendet werden, wie die Autoren betonen.
(sas)