智慧醫(yī)院需要持續(xù)筑牢安全防護(hù)墻,但并不意味著要把安全防護(hù)墻加高到滴水不進(jìn),、滴水不出的地步,。正如國家衛(wèi)生健康委規(guī)劃發(fā)展和信息司毛群安司長所說,,未來醫(yī)院的邊界會越來越模糊、協(xié)作更加頻繁,,傳統(tǒng)的醫(yī)療業(yè)務(wù)流程可能嵌入若干大數(shù)據(jù),、智能應(yīng)用,實(shí)現(xiàn)醫(yī)患互動,、臨床協(xié)作,、醫(yī)教研的互動。
同樣,,為增進(jìn)與衛(wèi)生健康部門,、公立醫(yī)院的互信,醫(yī)療大數(shù)據(jù),、人工智能行業(yè)需要擺脫對醫(yī)院大數(shù)據(jù)一味的渴求和索取,,從注重?cái)?shù)據(jù)數(shù)量,向注重?cái)?shù)據(jù)質(zhì)量和數(shù)據(jù)績效轉(zhuǎn)變,。針對公民個人數(shù)據(jù)采集,被稱為“歐盟數(shù)據(jù)憲章”的《一般數(shù)據(jù)保護(hù)條例》(GDPR)提出了“最小可用原則”,,即:個人數(shù)據(jù)的處理應(yīng)當(dāng)是為了實(shí)現(xiàn)數(shù)據(jù)處理目的而適當(dāng)?shù)?、相關(guān)的和必要的。因此,,數(shù)據(jù)開發(fā)方,、數(shù)據(jù)使用方應(yīng)當(dāng)確保數(shù)據(jù)濫用,或者被低效利用,。
為保護(hù)患者個人的數(shù)據(jù)隱私,,經(jīng)過清洗后,被用于二次開發(fā)的患者數(shù)據(jù)集中,,患者個人信息既不可被識別,,也不可被逆轉(zhuǎn)(即逆向破解,,將脫敏數(shù)據(jù)還原為原始數(shù)據(jù))。盡管主流醫(yī)療大數(shù)據(jù),、人工智能企業(yè)普遍擁有成熟的數(shù)據(jù)脫敏技術(shù),,但隨著數(shù)據(jù)量累計(jì)、數(shù)據(jù)交叉比對持續(xù),、新型算法模型被研發(fā),,脫敏數(shù)據(jù)被逆向破解的風(fēng)險(xiǎn)將持續(xù)加大。因此,,“最小可用”原則是保護(hù)患者數(shù)據(jù)隱私的最后一道防線,。
隨著技術(shù)革新,傳統(tǒng)深度學(xué)習(xí)也許將不再過度依賴數(shù)據(jù)量進(jìn)行算法訓(xùn)練,。作為新型神經(jīng)網(wǎng)絡(luò)的一個分支,,生成對抗網(wǎng)絡(luò)(GAN)通過分離出生成網(wǎng)絡(luò)、鑒別網(wǎng)絡(luò),,猶如一個警察和假鈔販子之間的對抗,,警察對假鈔的鑒別能力不斷提高,假鈔販子“以假亂真”能力也不斷提高,,最終機(jī)器對醫(yī)學(xué)影像的判斷準(zhǔn)確性將趨于甚至超過人類,。更重要的是,生成對抗網(wǎng)絡(luò)僅需要少量影像數(shù)據(jù)進(jìn)行算法訓(xùn)練,,且無需人工參與標(biāo)注,,從而符合“最小可用”原則。
國家衛(wèi)生健康委統(tǒng)計(jì)信息中心張學(xué)高主任在2019CHIMA大會開幕式上表示,,當(dāng)前,,我國醫(yī)院信息化在數(shù)據(jù)層面面臨以下問題:一是數(shù)據(jù)質(zhì)量普遍不高,,缺乏數(shù)據(jù)質(zhì)量的保障機(jī)制,;二是對已有標(biāo)準(zhǔn)的應(yīng)用和執(zhí)行滯后;三是術(shù)語類標(biāo)準(zhǔn),、新技術(shù)類標(biāo)準(zhǔn),、安全類標(biāo)準(zhǔn)不健全。
無論是在信息化時代,、互聯(lián)網(wǎng)時代,、大數(shù)據(jù)時代還是人工智能時代,數(shù)據(jù)質(zhì)量始終是靈魂,。對于醫(yī)院信息系統(tǒng)(HIS),、云平臺、AI算法這些數(shù)據(jù)“吞吐大戶”,我們既不能讓它們因“上頓不接下頓”而“營養(yǎng)不良”,,也不能喂食“過期變質(zhì)食品”而導(dǎo)致其“食品中毒”,,甚至對整個“食品工業(yè)”喪失信心并引發(fā)行業(yè)地震。
公立醫(yī)院是醫(yī)療衛(wèi)生服務(wù)主戰(zhàn)場,,也是數(shù)據(jù)治理的源頭,。“水源”一旦被嚴(yán)重污染,,公共平臺歸集數(shù)據(jù)后再進(jìn)行治理,,往往回天乏力。新近出版的《醫(yī)院數(shù)據(jù)治理:框架,、技術(shù)與實(shí)現(xiàn)》一書,,標(biāo)志著統(tǒng)計(jì)信息中心首次提出醫(yī)院數(shù)據(jù)治理的理念,梳理了醫(yī)院數(shù)據(jù)治理的實(shí)施重點(diǎn)和路徑,,結(jié)合國家級平臺建設(shè)項(xiàng)目實(shí)施等相關(guān)實(shí)踐,,應(yīng)對服務(wù)創(chuàng)新、數(shù)據(jù)質(zhì)量,、開放共享,、安全合規(guī)等方面存在挑戰(zhàn)。該書和筆者的一線調(diào)研呈現(xiàn)出若干迫切問題:
?。?)數(shù)據(jù)治理重?cái)?shù)量輕質(zhì)量:一些地方的全民健康信息化平臺建設(shè)先抓數(shù)據(jù)匯集,,再把好質(zhì)量關(guān),缺乏數(shù)據(jù)上傳審查機(jī)制,、數(shù)據(jù)質(zhì)量預(yù)警機(jī)制,,未經(jīng)驗(yàn)證、未經(jīng)處理的健康大數(shù)據(jù)只能是“一般垃圾”甚至是“有害垃圾”,;(2)數(shù)據(jù)治理重技術(shù)輕規(guī)制:醫(yī)院數(shù)據(jù)治理僅停留在技術(shù)框架層面,,在院內(nèi)尚未成立數(shù)據(jù)治理管理機(jī)構(gòu),在院外尚未建立第三方數(shù)據(jù)治理評估體系,;(3)數(shù)據(jù)治理重工程輕績效:把數(shù)據(jù)治理狹隘,、靜態(tài)地理解為工程項(xiàng)目,主管部門數(shù)據(jù)規(guī)則跟不上,,承建方運(yùn)營維護(hù)跟不上,,醫(yī)療機(jī)構(gòu)和社會各界對治理績效的獲得感不強(qiáng)。
在數(shù)據(jù)輸入端,,我國尚未對健康大數(shù)據(jù)(尤其是醫(yī)院大數(shù)據(jù))啟動國家立法,“健康醫(yī)療大數(shù)據(jù)”相關(guān)法規(guī)停留在部門規(guī)章層面,,且仍處在試行期,,且對健康大數(shù)據(jù)的分類、分級、分步共享開放的準(zhǔn)則,,及其易于操作的流程,,尚未作出具體規(guī)定。在算法輸出端,,我國對醫(yī)療人工智能的算法模型的著作權(quán)尚未得到法律保障,。我國知識產(chǎn)權(quán)的主要判定依據(jù)是《著作權(quán)法實(shí)施條例》,該條例的修正案早在2013年3月1日就開始施行,,趕不上醫(yī)療人工智能技術(shù)發(fā)展的新趨勢,。
綜上所述,立法位階不高,、法條不夠明晰,、法律約束力不強(qiáng),導(dǎo)致一些地方,、一些醫(yī)院的數(shù)據(jù)治理規(guī)則出現(xiàn)較大隨意性,,容易出現(xiàn)因時而異(如:人工智能進(jìn)入某個“風(fēng)口期”)、因事而異(如:醫(yī)院自發(fā)提出科研合作需求),、因人而異(如:持開放態(tài)度的衛(wèi)健委領(lǐng)導(dǎo),、醫(yī)院領(lǐng)導(dǎo)、信息辦主任),。制度剛性缺失,,給醫(yī)療人工智能企業(yè)的數(shù)據(jù)可用性、低成本帶來巨大挑戰(zhàn),,也導(dǎo)致算法模型無法根據(jù)“額頭出汗原則”的著作權(quán)原則歸研發(fā)團(tuán)隊(duì)所有,,無法對醫(yī)療人工智能研發(fā)提供穩(wěn)定盈利預(yù)期、研發(fā)激勵機(jī)制,。