Zu Auswirkungen und zur Verbesserung der Versorgung der Patienten der Studie der künstlichen Intelligenz (KI) Werkzeuge zur Unterstützung der screening-Mammographie muss jetzt die Verlagerung von der simulierten Studien zu den robusten klinischen Auswertungen, nach Constance Lehman, MD, Ph. D., Direktor des Breast Imaging am Massachusetts General Hospital (MGH).
In einem Kommentar in JAMA Oncology, Lehman lobte Forscher in einer aktuellen Studie berichtete über die Leistung der drei zur Verfügung stehenden AI-tools in einer hohen Qualität moderne, alle-digitale Mammographie-screening-Datenbank und vereinbart, dass die Zeit gekommen ist, um Fortschritte über simulierte Forschung Strategien, um sorgfältig zu Messen und bestimmen die Leistung der Modelle in der klinischen Praxis.
„In der weiteren Entwicklung der KI angewandt, um die Verbesserung der menschlichen Gesundheit, es ist Zeit, hinaus zu gehen, simulation und Leser Studien und geben Sie die kritische phase der strenge, prospektive klinische evaluation“, sagte Lehman in Ihrer Kommentierung der Studie.
Der Leiter des breast imaging at MGH wies darauf hin, dass die frühen Bemühungen um die Entwicklung KI-basierte deep-learning-Modellen zu unterstützen die Menschen im Mammographie-interpretation haben zu gemischten Ergebnissen geführt, darunter auch große Unterschiede in der Quantität und Qualität von Daten für Modellentwicklung und Variablen Methoden zu trainieren, zu testen und intern und extern zu validieren deep-learning-Modelle.
„Arbeiten in der Entwicklung und Validierung benötigt wird, in größeren Datenbanken, einschließlich tomosynthesis Untersuchungen und diverse [kommerziellen AI] – Anbietern und-Populationen,“ Lehman erklärt. „Aber am wichtigsten ist, rigorose Studien zu beurteilen, ob die Ergebnisse von der simulation Studien übertragen werden, um Erfolg in der routine der klinischen Praxis unverzichtbar sind.“
Lehman gutgeschrieben die Forscher [Salim und Kollegen] für einen wichtigen nächsten Schritt in der Entdeckung Prozess durch die Verwendung von großen, kuratiert von screening-Mammographie-Datenbank zum vergleichen der Leistung der drei kommerziellen algorithmen.
Diese Methodik führte zu der Feststellung, dass eine von den drei kommerziellen Modellen erreicht eine Sensitivität von 81,9% mit der Spezifität set auf 96.6%. Diese Ergebnisse vergleichen günstig mit den USA Breast Cancer Surveillance Consortium benchmarks von 86,9% Sensitivität und 88.9% Spezifität.
Darüber hinaus Lehman fand faszinierend die Autoren „Einblicke, die Herausforderung, bestehende Annahmen in das Feld ein.“ Sie zitierten Ergebnisse darauf hindeutet, dass „die Zahl der Fälle wichtiger sein kann als die Vielfalt von Anbietern oder Patientenpopulationen in den Datenbanken der Entwicklung des Algorithmus.“
Lehman ging auf, um beachten Sie, dass die leistungsfähigsten Algorithmus wurde entwickelt von der größten Datensatz von screening-Mammographie—72,000 Krebs Bilder und 680,000 normale Bilder im leistungsstärksten Modell, im Vergleich zu 6.000 Krebs-Bilder und 106,000 normale Bilder in den schlechtesten Modell.
In dem Aufruf für weitere Studien, Lehman, der auch professor für Radiologie an der Harvard Medical School, der meinte, dass vor der Ausfälle mit computer-aided-detection – (CAD -) Programme, die dazu dienen sollte, eine warnende Lektion für die Zukunft.
„Obwohl der frühe Leser und simulation Studien, die von traditionellen CAD-waren vielversprechend, am Ende bessere Ergebnisse für Patienten, die Mammographie Interpretationen unterstützt durch CAD nicht gezeigt wurden“, führte Sie aus. „Viele Studien haben bestätigt, dass Menschen reagieren unterschiedlich auf die CAD-Unterstützung, und das gleiche gilt für die KI-gestützte Lesungen.“