在這篇文章中,Jeff Dean 等人工智能大牛描繪了一幅機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用藍(lán)圖,。
先來看兩個(gè)場景:
場景 1:
一名 49 歲的病人注意到肩膀上起了皮疹,,因?yàn)椴挥X得疼痛,,所以也沒有尋求治療。幾個(gè)月之后,,他的妻子讓他去看醫(yī)生,,醫(yī)生診斷出他患了脂溢性角化癥。后來,,當(dāng)該患者在做腸鏡篩查時(shí),,護(hù)士注意到他的肩膀上有黑色斑點(diǎn),于是建議他去檢查一下,。又過了一個(gè)月,,這位患者去看皮膚科醫(yī)生,醫(yī)生從病變的地方取了一些活檢樣本,。結(jié)果顯示這是一種非癌性色素沉淀病變,。醫(yī)生還是很擔(dān)心,建議二次檢測活檢樣本,,最終診斷出了侵襲性黑色素瘤,。之后,腫瘤科醫(yī)生用全身化療的方法治療這位患者,。一位醫(yī)生朋友問病人為什么不接受免疫治療,。
場景 2:
一名 49 歲的病人用手機(jī) app 拍了一張肩膀上皮疹的照片,app 建議他立即預(yù)約皮膚科醫(yī)生,。他的保險(xiǎn)公司自動批準(zhǔn)直接轉(zhuǎn)診,,app 幫他在兩天內(nèi)預(yù)約了附近一名經(jīng)驗(yàn)豐富的皮膚科醫(yī)生,該預(yù)約和患者的個(gè)人行程自動交叉核對過了,。皮膚科醫(yī)生對病變處進(jìn)行了活檢,,病理學(xué)家在計(jì)算機(jī)輔助下診斷出 Ⅰ 期黑色素瘤,然后皮膚科醫(yī)生進(jìn)行了摘除手術(shù),。
對比場景 1 和場景 2,,我們可以發(fā)現(xiàn),在同樣的一個(gè)病例中,,場景 2 的醫(yī)療流程實(shí)現(xiàn)了以下優(yōu)化:1)患者可以直接用手機(jī)拍攝病變照片,,由 app 進(jìn)行初級診斷,系統(tǒng)可以根據(jù) app 提供的建議合理分配醫(yī)療資源,;2)皮膚科醫(yī)生和病理學(xué)家實(shí)現(xiàn)了有效的協(xié)作,,相當(dāng)于讓一位普通病人也得到了專家會診,提高了診斷和治療方法的準(zhǔn)確性,。這就是 Jeff Dean 等人為我們描繪的機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用藍(lán)圖,。
如果重癥監(jiān)護(hù)人員或社區(qū)醫(yī)療人員每做出一個(gè)醫(yī)療決定,立刻就會有相關(guān)領(lǐng)域的專家組成的團(tuán)隊(duì)對這條決定進(jìn)行審查,,判斷這條決定是否正確并對其進(jìn)行指導(dǎo),,那會是什么樣呢?最新診斷出沒有并發(fā)癥的高血壓患者將會接受現(xiàn)有最有效也最對癥的治療,,而不是診斷者最熟悉的治療方法,。這樣可以很大程度上消除用藥過量和處方錯(cuò)誤的問題?;加猩衩厍液币娂膊〉幕颊呖梢灾苯佑上嚓P(guān)領(lǐng)域的知名專家會診,。
這樣的系統(tǒng)似乎離我們很遠(yuǎn)。因?yàn)闆]有足夠的專家可以配合這樣的系統(tǒng),。就算有,,對專家們來說,不僅要花很長時(shí)間了解患者的病史,,而且與隱私相關(guān)的問題可能也會成為阻礙,。但這就是用于醫(yī)療領(lǐng)域的機(jī)器學(xué)習(xí)的前景——幾乎所有臨床醫(yī)生所做的診斷決定以及數(shù)十億患者的診斷結(jié)果組成的智慧結(jié)晶應(yīng)該為每一位患者的醫(yī)療護(hù)理提供指導(dǎo)。也就是說,,應(yīng)該根據(jù)患者所有已知的實(shí)時(shí)信息和集體經(jīng)驗(yàn)得出個(gè)性化的診斷,、管理決策以及治療方案。
這種框架強(qiáng)調(diào)機(jī)器學(xué)習(xí)不僅是像新藥或者新的醫(yī)療器械這樣全新的工具,,而是一種基礎(chǔ)技術(shù),,這種技術(shù)可以高效處理超出人類大腦負(fù)荷的數(shù)據(jù)。這種巨大的信息存儲涉及到龐大的臨床數(shù)據(jù)庫,,甚至單個(gè)患者的數(shù)據(jù),。
50 年前的一篇專題文章指出,計(jì)算將「強(qiáng)化,,在有些情況下可以很大程度上取代醫(yī)生的智慧」,。但到 2019 年初,由機(jī)器學(xué)習(xí)驅(qū)動的醫(yī)療保健幾乎還沒有取得什么進(jìn)展,。我們在此不再贅述之前報(bào)道過的無數(shù)通過測試的概念驗(yàn)證模型(回顧性數(shù)據(jù)),,而是要說一些醫(yī)療健康領(lǐng)域的核心結(jié)構(gòu)變化及范式轉(zhuǎn)變,,這對于實(shí)現(xiàn)機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域的前景來說是必需的。
機(jī)器學(xué)習(xí)解釋
傳統(tǒng)上講,,軟件工程師通過清晰的計(jì)算機(jī)代碼形式提取知識,,從而指導(dǎo)計(jì)算機(jī)如何處理數(shù)據(jù)并做出正確的決策。例如,,如果病人血壓升高,,而且沒有接受抗高血壓藥物的治療,那正確編程的計(jì)算機(jī)可以提出治療建議,。這類基于規(guī)則的系統(tǒng)具有邏輯性和可解釋性,,但正如 1987 年的一篇文章中所說,醫(yī)療領(lǐng)域「太過廣泛也太過復(fù)雜,,因此難以(如果可能的話)在規(guī)則中捕獲相關(guān)信息」,。
傳統(tǒng)方法和機(jī)器學(xué)習(xí)之間的關(guān)鍵區(qū)別在于,在機(jī)器學(xué)習(xí)中,,模型是從樣本中學(xué)習(xí)而不是按規(guī)則編程的,。對于給定任務(wù),樣本給定輸入(特征)和輸出(標(biāo)簽),。例如,,將病理學(xué)家讀取的數(shù)字化切片轉(zhuǎn)換為特征(切片像素)和標(biāo)簽(上面的信息表明切片是否包含指示癌變的證據(jù))。用算法從觀測值中學(xué)習(xí),,然后計(jì)算機(jī)決定如何從特征映射到標(biāo)簽,,從而創(chuàng)建泛化模型,這樣就可以在未曾見過的輸入上正確執(zhí)行新任務(wù)(例如,,從未被人讀取過的病理學(xué)切片),。圖 1 總結(jié)了這一過程,這就是所謂的有監(jiān)督的機(jī)器學(xué)習(xí),。還有其他形式的機(jī)器學(xué)習(xí),。表 1 列出了用于臨床的案例,這些模型的輸入輸出映射基本上都是基于同行評審研究或現(xiàn)有機(jī)器學(xué)習(xí)的擴(kuò)展,。
圖 1:有監(jiān)督機(jī)器學(xué)習(xí)的概念性概述
表 1:推動機(jī)器學(xué)習(xí)應(yīng)用的輸入數(shù)據(jù)和輸出數(shù)據(jù)類型示例,。
在實(shí)際應(yīng)用中,預(yù)測準(zhǔn)確性至關(guān)重要,,模型在數(shù)百萬特征和樣例中找出統(tǒng)計(jì)模式的能力絕對可以超過人類的表現(xiàn),。但這些模式不一定適應(yīng)基本的生物學(xué)鑒定方式,也不一定能識別支持新療法的開發(fā)過程中可修改的危險(xiǎn)因素,。
機(jī)器學(xué)習(xí)模型和傳統(tǒng)的統(tǒng)計(jì)模型之間并非涇渭分明,,最近有一篇文章總結(jié)了這兩者之間的關(guān)系。但復(fù)雜的新型機(jī)器學(xué)習(xí)模型(比如「深度學(xué)習(xí)」(一種利用人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,它可以學(xué)習(xí)到特征和標(biāo)簽之間極其復(fù)雜的關(guān)系,,在諸如圖像分類等任務(wù)上的表現(xiàn)已經(jīng)超越了人類))很適合學(xué)習(xí)現(xiàn)代臨床病例中產(chǎn)生的復(fù)雜,、異構(gòu)數(shù)據(jù)(比如醫(yī)生寫的醫(yī)療記錄、醫(yī)學(xué)圖像,、來自傳感器的連續(xù)監(jiān)控?cái)?shù)據(jù)以及基因組數(shù)據(jù)),,從而做出醫(yī)學(xué)相關(guān)的預(yù)測。表 2 提供了簡單和復(fù)雜的機(jī)器學(xué)習(xí)模型分別適用于什么樣的情況,。
表 2:決定要用哪種模型時(shí)要問的關(guān)鍵問題。
人類學(xué)習(xí)和機(jī)器學(xué)習(xí)之間的關(guān)鍵區(qū)別在于人類可以從少量數(shù)據(jù)中得到普適且復(fù)雜的關(guān)系,。例如,,小孩不用看太多樣本就能區(qū)分獵豹和貓。在學(xué)習(xí)相同任務(wù)的情況下,,和人相比機(jī)器需要更多的樣本,,而且機(jī)器不具備常識。但從另一個(gè)角度上講,,機(jī)器可以從大量數(shù)據(jù)中學(xué)習(xí),。用數(shù)千萬患者存儲在 EHR(Electronic Health Records,電子健康記錄)中的數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)模型是完全可行的,,這些數(shù)千億的數(shù)據(jù)點(diǎn)完全沒有任何重點(diǎn),,而人類醫(yī)生在整個(gè)職業(yè)生涯中都很難接診數(shù)萬名患者。
機(jī)器學(xué)習(xí)對臨床醫(yī)生的工作有何幫助
預(yù)后
機(jī)器學(xué)習(xí)模型可以學(xué)習(xí)患者的健康軌跡模式,。它可以得到超出醫(yī)生個(gè)體經(jīng)驗(yàn)的信息,,幫助醫(yī)生以專家水平預(yù)測出未來可能發(fā)生的事件。例如,,患者重返工作崗位的概率有多大,?疾病發(fā)展的速度會有多快?相同類型的預(yù)測可以在眾多患者中可靠地識別出將出現(xiàn)高危情況或可能頻繁需要醫(yī)療護(hù)理的患者,,這些信息可以作為附加信息幫助醫(yī)生,。
大型綜合衛(wèi)生系統(tǒng)已經(jīng)在用簡單的機(jī)器學(xué)習(xí)模型了,它可以自動識別可能需要轉(zhuǎn)移到重癥監(jiān)護(hù)室的住院患者,,回溯性研究表明,,可以用 EHR 和醫(yī)學(xué)圖像中的原始數(shù)據(jù)建立更復(fù)雜也更準(zhǔn)確的預(yù)后模型。
構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)需要用患者的縱向整合數(shù)據(jù)進(jìn)行訓(xùn)練,。只有當(dāng)訓(xùn)練模型的數(shù)據(jù)集中包含結(jié)果時(shí),,模型才能學(xué)習(xí)到患者的情況。但數(shù)據(jù)現(xiàn)在都是獨(dú)立存儲在 EHR 系統(tǒng),、醫(yī)學(xué)影像存檔和交互系統(tǒng),、付款人、PBM(Pharmacy Benefits Managers,藥品福利管理)甚至患者手機(jī)上的應(yīng)用中的,。自然的解決方案是將數(shù)據(jù)系統(tǒng)交到患者自己手中,,這也是我們長期以來一直倡導(dǎo)的解決方案,現(xiàn)在這一想法也已經(jīng)通過快速采用患者控制的應(yīng)用程序編程接口得以實(shí)現(xiàn),。
像 FHIR(Fast Healthcare Interoperability Resources,,快速醫(yī)療互操作性資源)這樣將數(shù)據(jù)轉(zhuǎn)化為統(tǒng)一格式可以更有效地聚合數(shù)據(jù)?;颊呖梢詻Q定哪些人可以用他們的數(shù)據(jù)來構(gòu)建或運(yùn)行模型,。盡管有人擔(dān)心技術(shù)的互操作性無法解決 EHR 數(shù)據(jù)中普遍存在的語義標(biāo)準(zhǔn)化問題,但 HTML(Hypertext Markup Language,,超文本標(biāo)記語言)可以索引 Web 數(shù)據(jù),,還可以用在搜索引擎上。
診斷
每一位患者都是獨(dú)一無二的,,但最好的醫(yī)生可以在正常范圍內(nèi)確定患者特有的微弱信號或異常值,。可以用機(jī)器學(xué)習(xí)檢測出的統(tǒng)計(jì)模式幫助醫(yī)生識別診斷不到的病癥嗎,?
醫(yī)學(xué)研究所的結(jié)論是,,幾乎每一位患者在他(她)的一生中都會遇到一次誤診,而正確的診斷是采用合適治療方法的基礎(chǔ),。這個(gè)問題不止在一些罕見的病癥中會出現(xiàn),。在發(fā)展中國家,即便有充足的治療手段,、檢查時(shí)間和培訓(xùn)充分的醫(yī)護(hù)人員,,也無法檢查出急性胸痛、肺結(jié)核,、痢疾以及分娩期間的并發(fā)癥,。
常規(guī)醫(yī)療護(hù)理期間收集到的數(shù)據(jù)表明,可以在臨床診斷中用機(jī)器學(xué)習(xí)來判斷可能的診斷,,這樣可以提高對以后可能出現(xiàn)的情況的認(rèn)識,。但這樣的方法有局限性。生疏的臨床醫(yī)生可能無法正確提取模型必需的信息,,因而無法讓模型變得有意義,。模型得到的結(jié)果可能建立在臨時(shí)或錯(cuò)誤的診斷之上,可能建立在不能證明是病癥的不良反應(yīng)條件之上(從而造成過度診斷),,可能受計(jì)費(fèi)的影響,,或者可能根本沒有記錄。但模型會根據(jù)這些實(shí)時(shí)收集的數(shù)據(jù)給醫(yī)生提出建議,,這些建議在誤診率很高和臨床醫(yī)生不確定的情況中是很有用的,。在臨床上正確的診斷和 EHR 中或報(bào)銷索賠中的記錄的不一致意味著臨床醫(yī)生應(yīng)該從一開始就參與到產(chǎn)生數(shù)據(jù)的過程中來,,這些數(shù)據(jù)會作為常規(guī)護(hù)理的一部分,而且之后還會用于自動診斷過程,。
訓(xùn)練成功的模型可以回溯識別各種圖像類型的異常(表 1),。但將機(jī)器學(xué)習(xí)模型作為臨床醫(yī)生常規(guī)工作一部分的回溯試驗(yàn)的數(shù)量非常有限。
治療
在數(shù)萬名醫(yī)生要治療數(shù)千萬患者的大型醫(yī)療系統(tǒng)中,,患者在什么時(shí)候?yàn)槭裁淳驮\以及情況相似的患者應(yīng)該如何治療都是有差異的,。模型是否可以對這些差異進(jìn)行分類,從而幫助醫(yī)生確定首選治療途徑,?
一個(gè)比較簡單的應(yīng)用是比較定點(diǎn)照護(hù)(point of care)的處方和模型得到的處方,,可以將差異標(biāo)記出來后再次核查(例如,其他臨床醫(yī)生傾向于使用可以反映新方法的替代療法),?;跉v史數(shù)據(jù)訓(xùn)練的模型只能學(xué)習(xí)醫(yī)生的處方習(xí)慣,但這并不一定是理想做法,。為了了解療效最好的藥物和治療方法,需要精心收集數(shù)據(jù)并評估因果效應(yīng),,而機(jī)器學(xué)習(xí)模型則不一定能(有時(shí)候也不能用給定的數(shù)據(jù)集)識別這些效應(yīng),。
根據(jù)觀察數(shù)據(jù)比較療效研究和實(shí)用性實(shí)驗(yàn)的傳統(tǒng)方法也提供了重要看法。但近期使用機(jī)器學(xué)習(xí)方法的試驗(yàn)表明,,和專家一起生成人工篩查過的數(shù)據(jù)集,、更新模型以納入新發(fā)表的數(shù)據(jù)、根據(jù)不同領(lǐng)域的處方進(jìn)行調(diào)整以及從 EHR 中自動提取相關(guān)變量都是很大的挑戰(zhàn),。
還可以用機(jī)器學(xué)習(xí)自動選擇患者,,根據(jù)臨床記錄,這些患者可能適合進(jìn)行隨機(jī)對照試驗(yàn),;或者可以用機(jī)器學(xué)習(xí)自動識別可能用早期研究或新療法治愈的高風(fēng)險(xiǎn)患者或亞群,。這些工具促使醫(yī)療健康系統(tǒng)研究每一種臨床情況,可以在降低成本和管理費(fèi)用的同時(shí)進(jìn)行更嚴(yán)格的研究,。
臨床工作流程
EHR 的引入提高了數(shù)據(jù)的可用性,。但這些系統(tǒng)也因費(fèi)用過高、管理文檔的復(fù)選框過多,、用戶界面不夠友好,、輸入數(shù)據(jù)花費(fèi)的時(shí)間過長以及產(chǎn)生新的醫(yī)療錯(cuò)誤等讓臨床醫(yī)生們灰頭土臉。
也可以將機(jī)器學(xué)習(xí)技術(shù)用在其他消費(fèi)產(chǎn)品中以提高臨床醫(yī)生們的效率,。驅(qū)動搜索引擎的機(jī)器學(xué)習(xí)可以在無需臨床醫(yī)生多次點(diǎn)擊的情況下找出患者數(shù)據(jù)的相關(guān)信息,。用機(jī)器學(xué)習(xí)技術(shù)(如預(yù)測類型、語音聽寫和自動摘要等)可以大大改進(jìn)表格和文本數(shù)據(jù)的輸入,。根據(jù)患者表格中的信息自動授權(quán)支付的模型可以取代提前授權(quán),。使用這些工具不僅僅只是為了方便醫(yī)生。無障礙地查看和輸入臨床上的有效數(shù)據(jù)對捕獲和記錄醫(yī)療健康數(shù)據(jù)來說至關(guān)重要,這反過來也可以在機(jī)器學(xué)習(xí)的輔助下為每一位患者提供最好的醫(yī)療護(hù)理幫助,。最重要的是,,這種做法提高了效率、簡化了記錄,,而且改進(jìn)了自動化臨床工作流程,,這樣臨床醫(yī)生就可以把更多的時(shí)間花在患者身上。
在 EHR 系統(tǒng)之外,,機(jī)器學(xué)習(xí)技術(shù)也可以用于外科手術(shù)的實(shí)時(shí)視頻分析,,可以幫助外科醫(yī)生避免在關(guān)鍵結(jié)構(gòu)解剖時(shí)出現(xiàn)問題或者患者身體有意料之外的改變,甚至可以處理更普通的任務(wù)——比如準(zhǔn)確計(jì)算手術(shù)海綿的數(shù)量,。檢查清單(checklist)可以避免手術(shù)錯(cuò)誤,,還可以自動監(jiān)控手術(shù)過程,提高手術(shù)的安全性,。
在臨床醫(yī)生的個(gè)人生活中,,他們可能在自己的智能手機(jī)上用到了所有這些技術(shù)的變體。盡管有將這些技術(shù)應(yīng)用于醫(yī)學(xué)背景的概念驗(yàn)證的研究,,但主要的障礙不是模型的開發(fā),,而是技術(shù)的基礎(chǔ)設(shè)施——EHR 之上的法律、隱私和政策框架,、衛(wèi)生系統(tǒng)以及技術(shù)供應(yīng)商,。
擴(kuò)大臨床專業(yè)知識的可用性
醫(yī)生不可能照料到所有需要治療的患者。機(jī)器學(xué)習(xí)是否可以在不需要醫(yī)生親自參與的情況下,,擴(kuò)大醫(yī)生診治范圍,、提供專家級醫(yī)療評估呢?例如,,剛剛發(fā)皮疹的患者可能只要用手機(jī)發(fā)送一張照片就可以獲得診斷,,從而避免掛不必要的急診。本身要去急診室就診的患者可能在自動診斷系統(tǒng)就能獲得診斷,,并在適當(dāng)?shù)臅r(shí)候以另一種形式進(jìn)行護(hù)理,。當(dāng)患者確實(shí)需要專業(yè)幫助時(shí),模型也可以識別出專業(yè)最相關(guān)且處于空閑狀態(tài)的醫(yī)生,。同樣,,為了提高舒適度并降低成本,如果機(jī)器可以遠(yuǎn)程監(jiān)控病人的傳感器數(shù)據(jù),,本身需要住院治療的病人就可以在家里接受護(hù)理了,。
世界上有一些地區(qū),直接學(xué)習(xí)醫(yī)學(xué)專業(yè)知識的渠道有限,,而且非常復(fù)雜,,因而將機(jī)器學(xué)習(xí)的真知灼見直接傳遞給病人變得越來越重要,。即便是在那些專家醫(yī)生充足的區(qū)域,這些醫(yī)生擔(dān)心他們的能力和努力無法及時(shí)且準(zhǔn)確地解釋那些浪潮一般的數(shù)據(jù),,這些數(shù)據(jù)一般是從患者穿戴的傳感器或活動追蹤設(shè)備中得到的,,并且由患者自己驅(qū)動。事實(shí)上,,用數(shù)百萬患者的數(shù)據(jù)訓(xùn)練得到的機(jī)器學(xué)習(xí)模型可以幫助專業(yè)醫(yī)護(hù)人士做出更好的決策,。例如,護(hù)士可以承擔(dān)通常由醫(yī)生完成的醫(yī)療工作,,初級護(hù)理醫(yī)生則可以承擔(dān)通常由醫(yī)療專家完成的工作,,而醫(yī)療專家則可以將更多的時(shí)間投入到非常需要他們專業(yè)知識的病人身上。
不涉及機(jī)器學(xué)習(xí)的移動應(yīng)用或網(wǎng)絡(luò)服務(wù)已被證明可以改善藥物的依賴性,,還可以控制各種慢性病,。但正式的回顧性和前瞻性評估方法阻礙了患者直接應(yīng)用機(jī)器學(xué)習(xí)。
主要挑戰(zhàn)
高質(zhì)量數(shù)據(jù)的可用性
構(gòu)建機(jī)器學(xué)習(xí)模型的核心挑戰(zhàn)在于組裝具有代表性的多樣化數(shù)據(jù)集,。理想做法是在使用過程中利用最接近期望數(shù)據(jù)準(zhǔn)確格式和質(zhì)量的數(shù)據(jù)來訓(xùn)練模型,。例如,對于打算用在即時(shí)護(hù)理中的模型而言,,最好使用 EHR 在特定情況下所用的同一數(shù)據(jù),,即便已知這些數(shù)據(jù)不可靠或這些數(shù)據(jù)受到了不必要變化的影響。當(dāng)數(shù)據(jù)集足夠大時(shí),,現(xiàn)代模型可以成功被訓(xùn)練,,以將嘈雜輸入映射到嘈雜輸出,。使用人工篩查數(shù)據(jù)(比如那些在臨床試驗(yàn)中從人工病例審查得到的數(shù)據(jù))得到的更小數(shù)據(jù)集就不太理想,,除非希望醫(yī)生根據(jù)原始實(shí)驗(yàn)規(guī)范手動提取變量。這種做法對某些變量來說或許可行,,但對于做出最準(zhǔn)確預(yù)測所必需的,、EHR 中數(shù)十萬的數(shù)據(jù)而言就太不可行了。
俗話說「垃圾進(jìn),,垃圾出」(garbage in, garbage out),,那么我們?nèi)绾螀f(xié)調(diào)噪聲數(shù)據(jù)集來訓(xùn)練模型呢?要學(xué)習(xí)大多數(shù)復(fù)雜的統(tǒng)計(jì)模式最好還是有大數(shù)據(jù)集(哪怕是噪聲數(shù)據(jù)),,以便對模型進(jìn)行微調(diào)和評估,,但具有人工篩查標(biāo)簽的更小樣例集還是有必要的。當(dāng)原始數(shù)據(jù)可能標(biāo)記錯(cuò)誤時(shí),,這種樣例集可以就模型對預(yù)期標(biāo)簽的預(yù)測做出正確的評估,。對成像模型來說,這通常需要生成由每張圖片的多個(gè)評分器判定的「ground truth」標(biāo)簽(即由一位絕對可靠的專家指定給一個(gè)樣例的診斷或發(fā)現(xiàn)),,但對非成像任務(wù)來說,,如果沒能獲得必要的診斷測試,,那可能也無法獲得「ground truth」標(biāo)簽。
一般情況下,,訓(xùn)練數(shù)據(jù)越多機(jī)器學(xué)習(xí)模型表現(xiàn)得越好,。因此,對于機(jī)器學(xué)習(xí)的使用而言,,一個(gè)關(guān)鍵的問題是在利用大且多樣化數(shù)據(jù)集以提高機(jī)器學(xué)習(xí)模型準(zhǔn)確率的同時(shí),,需要平衡隱私問題和監(jiān)管要求。
從過去的失敗經(jīng)驗(yàn)中學(xué)習(xí)
人類的所有活動都會被意料之外的偏差破壞,。機(jī)器學(xué)習(xí)系統(tǒng)的構(gòu)建者和使用者需要仔細(xì)考慮偏差如何影響用于訓(xùn)練模型的數(shù)據(jù),,并采取措施解決和監(jiān)控這些偏差。
機(jī)器學(xué)習(xí)的優(yōu)勢(也是劣勢之一)在于模型可以識別到人類無法找到的歷史數(shù)據(jù)模式,。醫(yī)療實(shí)踐的歷史數(shù)據(jù)表明,,人們能得到的系統(tǒng)性醫(yī)療護(hù)理是存在差異的,一般為弱勢群體提供的醫(yī)療護(hù)理較其他群體更差一些,。在美國,,歷史數(shù)據(jù)反映了一種支付系統(tǒng),該系統(tǒng)會獎勵使用不必要護(hù)理和服務(wù)的人,,這樣可能會錯(cuò)過那些本該卻并未得到護(hù)理的病人(比如沒有保險(xiǎn)的患者),。
監(jiān)管、監(jiān)督和安全使用的專業(yè)知識
衛(wèi)生系統(tǒng)已經(jīng)建立了可以確保將藥物安全傳遞到患者手上的復(fù)雜機(jī)制,。機(jī)器學(xué)習(xí)的廣泛適用性也需要同樣復(fù)雜的監(jiān)管結(jié)構(gòu),、法律框架以及當(dāng)?shù)貙?shí)踐以確保系統(tǒng)的安全開發(fā)、使用和監(jiān)管,。此外,,技術(shù)公司必須要提供可擴(kuò)展的計(jì)算平臺來處理大量數(shù)據(jù)和模型使用的問題,但到現(xiàn)在他們也不清楚自己的定位,。
重要的是,,使用機(jī)器學(xué)習(xí)系統(tǒng)的醫(yī)生和病人都需要理解其局限性,包括模型并不能泛化到特定場景,。做決策或分析圖像時(shí)過度依賴機(jī)器學(xué)習(xí)模型可能會導(dǎo)致自動化偏差,,而醫(yī)生可能已經(jīng)降低其對這些偏差的警惕。如果模型的可解釋性不夠強(qiáng),,醫(yī)生可能意識不到模型給出了錯(cuò)誤的建議,,這時(shí)尤其會出現(xiàn)問題。在模型預(yù)測中表現(xiàn)出置信區(qū)間可能有所幫助,,但置信區(qū)間本身或許被錯(cuò)誤解釋,。因此,需要對使用中的模型進(jìn)行前瞻性的,、真實(shí)的臨床評估,,而不只是根據(jù)歷史數(shù)據(jù)集對模型性能做回顧性評估,。
需要特別考慮直接針對患者的機(jī)器學(xué)習(xí)應(yīng)用?;颊呖赡軣o法驗(yàn)證模型構(gòu)建者所說的話是否得到高質(zhì)量臨床證據(jù)的證實(shí),,也無法驗(yàn)證模型建議的行為是否合理。
研究結(jié)果的出版與傳播
構(gòu)建模型的跨學(xué)科團(tuán)隊(duì)可能會在臨床醫(yī)生不熟悉的場所匯報(bào)結(jié)果,。稿件通常會在 arXiv 和 bioRxiv 這樣的預(yù)印本服務(wù)網(wǎng)站上發(fā)布,,許多模型的源代碼則會在 GitHub 庫這樣的地方保存。此外,,許多同行評審的計(jì)算機(jī)科學(xué)稿件也并不會發(fā)布在傳統(tǒng)期刊上,,而會發(fā)表在 NeurIPS(神經(jīng)信息處理系統(tǒng)大會)和 ICML(國際機(jī)器學(xué)習(xí)大會)這樣的會議上。
結(jié)論
大量衛(wèi)生保健數(shù)據(jù)的加速創(chuàng)建將從根本上改變醫(yī)療保健的性質(zhì),。我們堅(jiān)信,,醫(yī)患關(guān)系將成為為患者提供醫(yī)療服務(wù)的基石,而這種關(guān)系會因機(jī)器學(xué)習(xí)的輔助而變得豐富,。我們期望在未來幾年會出現(xiàn)一些早期模型和同行評審的刊物,,它們的出現(xiàn)以及監(jiān)管框架和基于價(jià)值醫(yī)療的經(jīng)濟(jì)激勵的發(fā)展,都會成為對醫(yī)療領(lǐng)域應(yīng)用機(jī)器學(xué)習(xí)保持樂觀態(tài)度的理由,。我們期望在不遠(yuǎn)的未來,,數(shù)百萬臨床醫(yī)生在護(hù)理數(shù)十億患者時(shí),可以在機(jī)器學(xué)習(xí)模型的幫助下根據(jù)所有醫(yī)學(xué)相關(guān)數(shù)據(jù)做出決策,,從而為所有患者提供最好的護(hù)理方案,。