AI的醫學影像診斷率超過人類醫生
深度神經網絡的驚人表現
去年5月,Haenssle和他的同事們發現深度神經網絡在檢測皮膚癌方面的表現已經超越了經驗豐富的皮膚過敏產醫師。為此,他們首先利用超過10萬張圖像對神經網絡進行了訓練,其中包括黑色素瘤這一最為致命的皮膚癌類型,也包括大量良性病變的X光片圖像。在訓練過程中,他們同時告知深度神經網絡每一份圖像的正確診斷結果。
接下來,研究人員們利用這套神經網絡與來自世界各地的58位皮膚科醫生進行了皮膚圖像診斷比拼。據統計,皮膚科醫生能夠以88.9%與75.7%的準確率發現惡性黑色素瘤與非癌癥病變,相比之下神經網絡在這兩項診斷中的準確率則分別為95%與82.5%。
Haenssle表示,“其中有30位皮膚科專家最初堅信「什么都逃不出我的法眼」,但從結果來看卻是計算機更勝一籌。這臺機器的水平甚至超過了最出色的皮膚科醫師。”
▲ 上圖比較了深度神經網絡與58位皮膚科醫師利用同一組皮膚病變圖像識別黑色素瘤的能力。平均而言,算法的診斷效果要比人類醫師更好
可以看到,該算法(卷積神經網絡)在訓練中曾觀察過超過10萬張良性與惡性皮膚病變圖像,并與來自全球各地的58位皮膚科醫師同臺競爭,共同分析100張測試圖像(其中有20%為黑色素瘤圖像)。測試結果還統計了“正確診斷”率(即正確發現黑色素瘤的比例)與“誤診”率(即將無害病灶誤認為黑色素瘤的比例)兩項指標。很明顯,正確診斷率越高、誤診率越低,那么最終成績也就更好,在圖中更趨近左上角位置。全部58名醫師都獲得了不錯的成績,綠點代表的就是他們的平均成績。(紅點、藍點與橙點則分別代表頂尖專家、普通專家與新人醫師。)但從圖中的藍綠色菱形線可以看出,神經網絡的表現力壓人類醫師,且每一次都能提供病變可能屬于惡性腫瘤的具體概率值。頂尖醫師能夠得出與算法相當接近的診斷準確率曲線,但也有不少醫師的準確率位于曲線下方,代表得分較低。極少數醫師得到了高于神經網絡的診斷準確率,對應圖形出現在曲線的上方或左方。
這些發現表明,神經網絡確實有助于挽救病患生命。根據疾病控制與預防中心的統計資料,皮膚癌已經成為美國最常見的癌癥,而通過神經網絡進行早期診斷有可能對相關人群的存活率產生重大影響。根據美國癌癥協會的分析結果,如果在發現時黑色素瘤已經發展至晚期,則病患的五年生存率僅為15%至20%;但如果能夠早期發現,則生存率將提高至約97%。
目前,研究人員在乳腺癌、宮頸癌、肺癌、心力衰竭、糖尿病性視網膜病、潛在的肺結節以及前列腺癌等疾病方面,也得出了類似結論。
人類醫師仍然不可替代
即使神經網絡在圖像識別能力方面已經勝過了人類,也并不代表醫師這個職業會被徹底取代。Beam指出,一方面,雖然機器目前確實更擅長聽覺以及視覺等感知性任務,但在長鏈推理方面卻存在著明顯不足——因此無法確定特定患者應該怎樣哪一種最佳治療方法。他解釋稱,“我們不能過度強調目前所取得的成績。因為距離通用型醫療AI,我們仍有很長的發展道路要走。”
另外,盡管科學家們確實能夠通過訓練得到一套可以在診斷特定疾病時優于人類醫師的神經網絡,但這類成果還無法通過訓練掌握對多種不同異常狀況的判斷能力。Haenssle指出,“這就像是教計算機下某一種棋類,那它們確實學得很快、實力也很強。但要想讓計算機一口氣掌握世界上的所有棋類游戲,那暫時還不現實。”
深度神經網絡的未來發展方向可能是與醫師開展充分合作,而非徹底將其取代。例如,2016年哈佛大學的科學家們就開發出一套深度神經網絡,能夠以高達92.5%的準確率區分癌細胞與正常乳腺組織細胞。在測試當中,病理學家以96.6%的準確率擊敗了計算機;但在將深度神經網絡預測結果與病理學家的診斷意見相結合之后,得出的準確率快速提升到驚人的99.5%。
X射線之所以能夠給后世帶來深遠的影響,很大程度上源自倫琴決定不對自己的發現申請專利。他希望讓全世界都能從他的工作成果當中受益。而在今天,也就是倫琴于1901年獲得首屆諾貝爾物理學獎的一個多世紀之后,人工智能同樣有望將醫學成像技術推向倫琴當初根本無法想象的新高度。Haenssle表示,“我們對于未來前景充滿了期待。”

圖片新聞
最新活動更多
-
5月28日立即登記>> 【在線招商會】OFweek生命健康創新中心在線招商會
-
即日-5.30立即下載>> 【白皮書限時下載!】精選TE傳感器在醫療領域的應用
-
7月29日立即報名>> OFweek 2020中國醫療器械創新在線峰會暨展覽
-
精彩回顧立即查看>> 【精彩回顧】面向智能制造,智慧能源如何賦能企業
-
精彩回顧立即查看>> 聯想智慧中國行|聯想商用IoT新品發布會
-
精彩回顧立即查看>> 【在線直播】面向智能制造,智慧能源如何賦能企業
發表評論
請輸入評論內容...
請輸入評論/評論長度6~500個字
暫無評論
暫無評論