自基因測(cè)序技術(shù)被發(fā)明以來,建設(shè)人類基因組數(shù)據(jù)庫一直是各國基因組研究中心的核心內(nèi)容之一,,人類基因組數(shù)據(jù)庫的宗旨是為從事人類基因組研究的科學(xué)家和醫(yī)護(hù)人員提供人類基因組信息,。目前國際上人類基因組數(shù)據(jù)大多來源于西方白種人,然而不同人種的進(jìn)化差異會(huì)導(dǎo)致明顯的易感基因差異,、特異性位點(diǎn)突變頻率不同,、基因突變表觀差異等,因此在我國分子診斷與精準(zhǔn)醫(yī)學(xué)飛速發(fā)展的背景下,,建立高質(zhì)量的中國人群基因組數(shù)據(jù)庫已經(jīng)成為當(dāng)下制約分子醫(yī)學(xué)發(fā)展的重要壁壘,。今年兩會(huì)上,委員也建議應(yīng)盡快建立精準(zhǔn)醫(yī)學(xué)資源庫,,整合共享醫(yī)療大數(shù)據(jù),,促進(jìn)精準(zhǔn)醫(yī)學(xué)更好的發(fā)展,。
貝瑞和康作為致力于將高通量測(cè)序技術(shù)實(shí)現(xiàn)臨床轉(zhuǎn)化的行業(yè)領(lǐng)導(dǎo)者,早在2015年8月14日宣布與云計(jì)算服務(wù)平臺(tái)提供商阿里云達(dá)成合作,,共同打造以海量的中國人群基因組數(shù)據(jù)為核心的數(shù)據(jù)云,,實(shí)現(xiàn)對(duì)個(gè)人基因組數(shù)據(jù)的精準(zhǔn)解讀,。該項(xiàng)目由美國貝勒醫(yī)學(xué)院,、現(xiàn)任職貝瑞和康CIO的于福利教授牽頭,參與“神州基因組數(shù)據(jù)云”項(xiàng)目的研究人員達(dá)到了100多人,,由醫(yī)學(xué),、分子生物學(xué),、遺傳學(xué),、計(jì)算機(jī)編程等研究領(lǐng)域的博士組成,。項(xiàng)目組分成三個(gè)團(tuán)隊(duì),,一個(gè)是貝瑞和康的研究團(tuán)隊(duì),,一個(gè)是于福利在貝勒實(shí)驗(yàn)室的團(tuán)隊(duì),,另外一個(gè)則是專門做高性能運(yùn)算的阿里云團(tuán)隊(duì),。
神州基因組數(shù)據(jù)云,,是一個(gè)知識(shí)密集型項(xiàng)目,。
阿里云擁有批量計(jì)算服務(wù)的強(qiáng)大能力,,貝瑞和康則深耕基因檢測(cè)多年已積累超過百萬人群基因組數(shù)據(jù),,此次選取其中四十萬人份數(shù)據(jù)作為“神州基因組數(shù)據(jù)云”項(xiàng)目的第一階段數(shù)據(jù),旨在借助云計(jì)算對(duì)該數(shù)據(jù)資源進(jìn)行深入挖掘,,進(jìn)一步揭示中國人群遺傳突變分布,提升中國人遺傳疾病診斷的效率和精準(zhǔn)程度,。
當(dāng)基因測(cè)序成本迅速下降以后,,擁有數(shù)據(jù)量的多少不再是行業(yè)里唯一的競(jìng)爭(zhēng)優(yōu)勢(shì),,而是否能夠?qū)⒑A康拇髷?shù)據(jù)進(jìn)行解讀,,轉(zhuǎn)換成具體能夠應(yīng)用的有效信息,,才是測(cè)序企業(yè)發(fā)展的核心競(jìng)爭(zhēng)力,。光有云計(jì)算能力和基因組數(shù)據(jù)還不夠,,分析和注釋技術(shù)是能否達(dá)成項(xiàng)目目標(biāo)的內(nèi)在核心驅(qū)動(dòng)力,。該項(xiàng)目發(fā)布一年后,,也即2016年8月24日貝瑞和康公布了為基因數(shù)據(jù)分析開發(fā)的兩大核心專利技術(shù):Verita Trekker?變異位點(diǎn)檢測(cè)系統(tǒng)和Enliven?變異位點(diǎn)注釋系統(tǒng),。
Verita Trekker?經(jīng)過嚴(yán)格的基因型質(zhì)量控制,,SNP 檢測(cè)的靈敏度達(dá)99.00%,,特異性達(dá)99.99%,,真陽性率達(dá)99.90%;Indel 檢測(cè)的真陽性率達(dá)88.00%;家系樣本基因型真陽性率大于99.90%;各項(xiàng)指標(biāo)均屬國際業(yè)界一流水平,。而Enliven?則通過統(tǒng)計(jì)學(xué)計(jì)算和文本挖掘方法整合國際權(quán)威的超過50個(gè)數(shù)據(jù)庫和預(yù)測(cè)算法,,其中也包括“神州基因組數(shù)據(jù)云”項(xiàng)目所產(chǎn)生的中國人特有基因信息數(shù)據(jù)庫,。同時(shí),支持千萬篇文獻(xiàn)的即時(shí)查找,,全面覆蓋基因,、變異、表型,、疾病信息,,參考權(quán)威文獻(xiàn)、美國醫(yī)學(xué)遺傳學(xué)學(xué)會(huì)(ACMG)標(biāo)準(zhǔn)與實(shí)際基因型-表型對(duì)應(yīng),,在這樣完善的體系和先進(jìn)的算法的保障下,,能夠出具可靠的變異致病性結(jié)果,為科研工作者和臨床醫(yī)生更好的研究和制定精準(zhǔn)醫(yī)療方案提供幫助,。
在Verita Trekker?和Enliven?兩大核心技術(shù)共同驅(qū)動(dòng)下的“神州基因組數(shù)據(jù)云”項(xiàng)目取得了階段性的重要成果,。2016年9月8日,貝瑞和康已完成世界首個(gè)中國人群基因組數(shù)據(jù)庫建設(shè),,填補(bǔ)了國際基因數(shù)據(jù)庫中缺少中國人群特有基因組數(shù)據(jù)信息的空白,。
同年9月23日,在第十九屆全國臨床腫瘤學(xué)大會(huì)暨CSCO學(xué)術(shù)年會(huì)上,,貝瑞和康進(jìn)一步展示了該項(xiàng)目的重要成果應(yīng)用,。這其中包括與北京大學(xué)腫瘤醫(yī)院解云濤教授合作的“中國人遺傳性乳腺癌基因突變圖譜項(xiàng)目”,以及中國40萬人基因組大數(shù)據(jù)項(xiàng)目在臨床應(yīng)用層面上所取得的階段性成果,,結(jié)果顯示中國人乳腺癌基因突變和其他人種相比具有顯著性差異,。
項(xiàng)目由解云濤教授和于福利教授共同展示,可以看到采用Enliven?變異位點(diǎn)注釋系統(tǒng)對(duì)美國國家衛(wèi)生研究院的相關(guān)項(xiàng)目中的BRCA1,、BRCA2基因的2152個(gè)位點(diǎn)進(jìn)行注釋,,將注釋結(jié)果與以往報(bào)告結(jié)果對(duì)比,PPV(陽性預(yù)測(cè)值)達(dá)到99.3%,,充分驗(yàn)證了Enliven?注釋和解讀能力的準(zhǔn)確性,。在此基礎(chǔ)上,,貝瑞和康將自建的中國人基因組數(shù)據(jù)庫與萬例婦科腫瘤患者的基因數(shù)據(jù)進(jìn)行整合,建設(shè)成為全球最大的婦科腫瘤基因組數(shù)據(jù)庫,。
現(xiàn)在,,神州基因組數(shù)據(jù)云項(xiàng)目仍在進(jìn)行中,中國人群的基因組大數(shù)據(jù)正在成倍累積增長(zhǎng),。受益于測(cè)序成本下降,,降低獲得大量數(shù)據(jù)的難度,因此只要在數(shù)據(jù)解讀能力上快速突破,,中國非常有可能在生物基因信息解讀這一領(lǐng)域?qū)崿F(xiàn)彎道超車,。
“神州基因組數(shù)據(jù)云”項(xiàng)目的另一層意義則與我國醫(yī)療政策中正在力推的分級(jí)診療政策息息相關(guān)。通過與專家合作,,大數(shù)據(jù)體系為90%以上的醫(yī)院提供解讀能力,,這將對(duì)基層臨床產(chǎn)生重要的指導(dǎo)意義??梢韵胂?,在三四線城市,醫(yī)生利用該數(shù)據(jù)云平臺(tái)分析基因測(cè)序數(shù)據(jù),,在當(dāng)?shù)乜梢垣@得同樣質(zhì)量的檢測(cè)分析,,獲得和在大城市大醫(yī)院同等質(zhì)量的報(bào)告,就能夠進(jìn)一步促進(jìn)實(shí)現(xiàn)分級(jí)診療,。于福利教授展望道,。