如果有一天,,你突然發(fā)現(xiàn)身上的一顆痣變得有些奇怪,你會怎么做,?雖然這可能是一個危險的信號,,但很多人因為工作忙、去醫(yī)院不便等種種原因,,往往不會及時去檢查?,F(xiàn)在,人工智能為這個問題提供了更好的解決方案:在未來,,我們或許可以在手機上下載一個APP,,開個攝像頭讓機器醫(yī)生幫我們看一看,這是不是皮膚癌的早期癥狀,。
斯坦福大學(xué)一個聯(lián)合研究團隊開發(fā)出了一個皮膚癌診斷準(zhǔn)確率媲美人類醫(yī)生的人工智能,,相關(guān)成果刊發(fā)為了1月底《自然》雜志的封面論文,題為《達(dá)到皮膚科醫(yī)生水平的皮膚癌篩查深度神經(jīng)網(wǎng)絡(luò)》(Dermatologist-level classification of skin cancer with deep neural networks)。他們通過深度學(xué)習(xí)的方法,,用近13萬張痣,、皮疹和其他皮膚病變的圖像訓(xùn)練機器識別其中的皮膚癌癥狀,在與21位皮膚科醫(yī)生的診斷結(jié)果進行對比后,,他們發(fā)現(xiàn)這個深度神經(jīng)網(wǎng)絡(luò)的診斷準(zhǔn)確率與人類醫(yī)生不相上下,,在91%以上。
深度學(xué)習(xí)為醫(yī)學(xué)添磚加瓦
在中國,,皮膚癌并不是癌癥家族中特別矚目的成員,,這是因為黃種人的皮膚癌發(fā)病率要低于白種人。但在美國,,皮膚癌卻是最常見的癌癥之一,。每年約有540萬美國人罹患皮膚癌。以黑色素瘤為例,,如果在五年之內(nèi)的早期階段檢測并接受治療,,生存率在97%左右;但在晚期階段,,存活率會劇降到14%。因而,,早期篩查對皮膚癌患者來說生死攸關(guān),。
一般情況下,來到醫(yī)院或診所后,,醫(yī)生會基于視覺診斷進行臨床篩查,,再對疑似病變部位依次進行皮膚鏡檢查、活體組織切片檢查和病理學(xué)診斷,。
醫(yī)生使用皮膚鏡進行檢查,。但由于各種各樣的原因,很多人并不會及時為皮膚上出現(xiàn)的一些細(xì)小癥狀而跑一趟醫(yī)院,。因而,,基于人工智能的家用便攜式皮膚癌診斷設(shè)備將大大提高早期皮膚癌的篩查覆蓋率,挽救更多人的生命,。但是,,癌癥診斷,差之毫厘,,謬以千里,,人工智能能夠勝任將黑色素瘤從普通的痣中篩選出來的任務(wù)?斯坦福大學(xué)這個聯(lián)合研究團隊的結(jié)論是:基于深度學(xué)習(xí)的機器醫(yī)生診斷準(zhǔn)確率十分驚人,。
“我們意識到這是可行的,,機器不僅能做,而且能做得和人類一樣好”,斯坦福人工智能實驗室助理教授Sebastian Thrun說道,,“這時候我們的想法完全變了,。我們說,‘瞧吧,,這不僅僅是個學(xué)生作業(yè),,這可能有益于全人類’?!?br/>
這種視覺處理算法基于時下大熱的深度學(xué)習(xí),,即通過大量的數(shù)據(jù)作為示例來訓(xùn)練機器完成某些特定任務(wù)。近來深度學(xué)習(xí)不僅在視覺處理方面大放異彩,,也在其他不同的領(lǐng)域碩果累累,,譬如谷歌(微博)的圍棋AI阿爾法狗,就是在學(xué)習(xí)完3000萬張人類棋譜后擊敗世界圍棋冠軍李世石的,。在機器學(xué)習(xí)過程中,,開發(fā)者不再需要對解題方法進行編碼,而是任由計算機通過學(xué)習(xí)示例數(shù)據(jù)自己“摸索”出解法,。具體到皮膚癌診斷這個案例中,,就是研究者不再需要自己總結(jié)中皮膚癌在外觀上的一些規(guī)律性特征來教會計算機,而是由它自己總結(jié)其中的模式,。
以谷歌一個區(qū)別貓狗的算法為藍(lán)本
研發(fā)者們沒有自己另起爐灶,,而是以谷歌的一個能在128萬張圖像中識別1000種物體的算法為藍(lán)本進行加工。谷歌的這個算法原本是用來區(qū)分喵星人和汪星人的,,現(xiàn)在,,研究者們需要訓(xùn)練它區(qū)別良性脂溢性角化病(benign seborrheic keratosis)和角化細(xì)胞癌(keratinocyte carcinomas),、普通的痣和惡性黑色素瘤(malignant melanomas),。
但是,在數(shù)據(jù)方面,,研究團隊面臨的第一個問題就是并不存在一個現(xiàn)成可用的龐大皮膚癌數(shù)據(jù)庫,。所以,斯坦福人工智能實驗室從互聯(lián)網(wǎng)上收集數(shù)據(jù),,與斯坦福醫(yī)學(xué)院進行合作,,給這一大堆混亂的照片分類貼標(biāo)簽。這工作并不容易,,畢竟,,原始數(shù)據(jù)里的語言就有好幾種,光把這些翻譯統(tǒng)一就很耗時,。
接著,,聯(lián)合研究團隊再一起對這鍋大雜燴進行篩選,。專業(yè)的皮膚科醫(yī)生會使用皮膚鏡,一種手持的顯微鏡,,對相關(guān)部位的皮膚進行放大觀察,,形成的醫(yī)學(xué)影像具有一些固定標(biāo)準(zhǔn)。但這里的大多數(shù)照片不是專業(yè)的醫(yī)學(xué)影像,,角度,、尺寸和亮度五花八門。最后,,他們選出了129450張皮膚病變圖片,,其中包含2032種不同的疾病。每張照片是作為一個帶有相關(guān)疾病標(biāo)簽的像素輸入進算法的,。這樣,,研發(fā)者省去了許多前期的圖像分組工作,大大提高了數(shù)據(jù)量,。
圖片樣本:良性和惡性的上皮細(xì)胞/黑色素細(xì)胞/皮膚鏡下的黑色素細(xì)胞,。經(jīng)過訓(xùn)練后,研究者們使用由愛丁堡大學(xué)和國際皮膚影像合作項目(International Skin Imaging Collaboration Project)提供的高質(zhì)量的,、經(jīng)活檢證實的照片來檢測機器的學(xué)習(xí)成果,,照片涉及兩種最常見、也最致命的皮膚癌:惡性黑色素瘤和角質(zhì)形成細(xì)胞癌,。21位人類皮膚科醫(yī)生被要求觀察其中的370多張圖片,,并對每一張作出判斷:是要進一步進行活檢或治療,還是告訴病人一個好消息,。
在測試中,人工智能被要求完成三項診斷任務(wù):鑒別角化細(xì)胞癌,、鑒別黑色素瘤,,以及使用皮膚鏡圖像對黑色素瘤進行分類。研究者通過建構(gòu)敏感性(sensitivity)-特異性(specificity)曲線對算法的表現(xiàn)進行衡量,。敏感性體現(xiàn)了算法正確識別惡性病變的能力,,特異性體現(xiàn)了算法正確識別良性病變,即不誤診為癌癥的能力,。在所有三項任務(wù)中,,該人工智能表現(xiàn)與人類皮膚科醫(yī)生不相上下,敏感性達(dá)到91%,。
算法診斷不同數(shù)量的角化細(xì)胞和黑色素細(xì)胞圖片時的敏感性,,均在91%以上。除了媲美人類醫(yī)生的診斷敏感性之外,,該算法還有一大亮點,,它的敏感性是可以調(diào)節(jié)的,。研究者可以依據(jù)想要的診斷效果對敏感性進行調(diào)整。
未來的掌上醫(yī)生
這個算法現(xiàn)在還需要依托一個計算機運行,,但斯坦福的這個團隊會努力把它縮小到可以在手機上裝載的地步,。他們覺得這種改裝還是挺容易的,只是還需要更多實打?qū)嵉呐R床檢驗,。在不遠(yuǎn)的未來,,也許人們手指輕輕一點,就可以進行靠譜的皮膚癌診斷,。
Thrun實驗室的研究生Esteva說道,,“當(dāng)我想到智能手機強大的存在感后,我真是靈光一閃,。未來每個人口袋里都會裝著一個超級計算機,。如果我們用它來篩查皮膚癌,或者其他疾病呢,?“
誠然,,深度學(xué)習(xí)這塊土壤培植了太多可能性。斯坦福大學(xué)針對皮膚癌篩查的這個算法只是打開了通往新世界的一個小口子,,在未來,,基于深度學(xué)習(xí)的人工智能將在更廣闊的醫(yī)療領(lǐng)域內(nèi)與人類大夫們并肩作戰(zhàn)。