摘 要: 提出了一種基于胃鏡圖像的計(jì)算機(jī)輔助病灶檢測方法,。首先,,引入超像素理論,將胃鏡圖像分割成大小均勻且包含相似像素的若干區(qū)域,;然后,,分別提取顏色特征和紋理特征,并將其融合作為特征描述符,;最后,,采用二級(jí)串聯(lián)分類器進(jìn)行胃鏡圖像內(nèi)干擾區(qū)域的去除以及病灶區(qū)域的識(shí)別。實(shí)驗(yàn)結(jié)果表明,,本方法病灶檢測正確率(AUC)可達(dá)到91.588%,。
關(guān)鍵詞: 病灶檢測;顏色直方圖,;超像素,;LBP
隨著人類生活方式和日常飲食的改變,加之現(xiàn)代生活快節(jié)奏性與不規(guī)律性,,胃腸道疾病的發(fā)病率越來越高,。目前,胃部疾病的檢測主要借助于電子胃鏡,。醫(yī)學(xué)電子胃鏡主要由內(nèi)窺鏡,、視頻處理器和視頻顯示器組成。應(yīng)用電子胃鏡可以采集到高分辨率的醫(yī)學(xué)圖像,,如圖1所示,。臨床醫(yī)生可以靈活地操控電子胃鏡來實(shí)時(shí)地觀察胃鏡的病變區(qū)域。盡管如此,,由于診斷過程主要憑借臨床醫(yī)生的主觀性,,加之病理特征的多樣性和胃部環(huán)境的復(fù)雜性,胃病診斷的誤診率和漏診率仍居高不下,。因此,,研究與設(shè)計(jì)一種基于胃鏡圖像的計(jì)算機(jī)輔助檢測系統(tǒng)十分必要。
就目前來看,,此方面的研究主要集中在無線膠囊內(nèi)窺鏡圖像上,,其研究的焦點(diǎn)主要集中于小腸和結(jié)腸的病灶區(qū)域檢測。而針對(duì)于傳統(tǒng)胃鏡圖像的研究尚處于起步階段,,對(duì)于胃部病變的檢測尚未形成一種有效的方法,。縱觀前人的工作,,雖然檢測方法多種多樣,,但可以粗略概括為圖像預(yù)處理、特征提取和用分類器進(jìn)行識(shí)別3個(gè)步驟,。在圖像預(yù)處理階段,,圖像通常會(huì)被分割成小矩形塊[1]或相互重疊的圓形區(qū)域[2];接下來,,從分割后得到的區(qū)域提取各種不同特征,,包括顏色直方圖、局部二進(jìn)制模式(LBP)和小波域共生矩陣特征等,。在最近幾年中,,機(jī)器學(xué)習(xí)被廣泛地應(yīng)用到醫(yī)學(xué)圖像的病灶檢測領(lǐng)域當(dāng)中,例如支持向量機(jī)(SVM)[3],、貝葉斯推理和神經(jīng)網(wǎng)絡(luò)等,。
前人方法的主要缺陷在于過少地考慮了干擾因素的影響,提取特征相對(duì)單一,。針對(duì)以上問題,,本文提出了一種新的基于胃鏡圖像的病灶方法。首先,,運(yùn)用超像素的思想將圖像進(jìn)行分割,;然后,針對(duì)每一個(gè)分割后的區(qū)域,,分別提取適合于排除干擾和識(shí)別病灶的組合特征,;最后,采用二級(jí)串聯(lián)分類器進(jìn)行干擾區(qū)域的去除和病灶區(qū)域的識(shí)別,。
1 本方法中的相關(guān)技術(shù)
胃腸道不同于人體其他器官,,作為消化系統(tǒng)的一部分,它的生理環(huán)境十分復(fù)雜,,其表面經(jīng)常會(huì)被粘液,、氣泡和食物殘?jiān)雀采w,。除此之外,胃鏡的光照條件也極大地影響了圖像的質(zhì)量,。綜合前人工作的分析可知,,過多的噪聲極大地影響了病灶區(qū)域的識(shí)別準(zhǔn)確率。針對(duì)此種情況,,本文方法在圖像分割,、特征提取以及分類器的設(shè)計(jì)上進(jìn)行了相應(yīng)改進(jìn)。
1.1 基于超像素的區(qū)域劃分
超像素在計(jì)算機(jī)視覺中得到了廣泛應(yīng)用,,但是在病灶檢測領(lǐng)域尚未得到應(yīng)用,。參考文獻(xiàn)[4]提出了一種簡單線性迭代聚集算法(SLIC)來減少計(jì)算量。相比較于歸一化分割算法和快速漂移算法,,該算法具有耗時(shí)短,、超像素的尺寸和矩形度可調(diào)節(jié)的特點(diǎn)。
從實(shí)驗(yàn)結(jié)果可以看出,,對(duì)于干擾區(qū)域,,15維的HIS_I、30維的HSV_HV,、15維的Normalized RGB和15維的Opponent顏色特征表現(xiàn)出色,,其受試者工作特征曲線(ROC曲線)下面積均可達(dá)到97.32%、98.78%,、97.62%和99.27%,。對(duì)于病灶區(qū)域,45維的HSV_HV,、30維的RGB,、45維的RG、15維的Opponent特征表現(xiàn)良好,,其ROC曲線下面積均可達(dá)到90.76%,、91.19%、92.83%和91.68%,。然而單一的特征其代表性也比較單一,,在實(shí)際復(fù)雜的應(yīng)用環(huán)境中仍達(dá)不到理想的效果,因此本文方法將多種特征進(jìn)行融合,,通過多種特征的疊加來加強(qiáng)特征的魯棒性,,從而可以應(yīng)對(duì)復(fù)雜多變的應(yīng)用環(huán)境,其實(shí)驗(yàn)結(jié)果如圖2和圖3所示,。圖2中,,(1)表示HIS_I(15維)+HSV_HV(30維),NormRGB(45維)+OPPO(30維)+RGB(30維),;(2)表示OPPO(30維)+LBP(15維),;(3)表示OPPO(30維)+HUE(45維),;(4)表示OPPO(30維)+HUE(45維)+LBP(15維);(5)表示所有單個(gè)特征表現(xiàn)最好的組合,。圖3中,,(1)表示HIS_I(45維)+LBP(30維)+NormRGB(45維)+HUE(45維);(2)表示LBP(30維),,NormRGB(15維)+RG(30維);(3)表示LBP(30維)+NormRGB(45-d)+RG(45維)+OPPO(15維),;(4)表示LBP(30維)+RG(30維),;(5)表示LBP(30維)+RG(45維)+OPPO(45維);(6)表示RG(45維)+OPPO(15維)+RGB(30維),;(7)表示RG(45維)+OPPO(15維)+RGB(30維)+LBP(30維),;(8)表示所有單個(gè)特征表現(xiàn)最好的組合。
實(shí)驗(yàn)結(jié)果證明,,其組合后的特征性能平均高于任何一個(gè)單一特征,,達(dá)到了預(yù)期效果。在干擾區(qū)域排除階段,,特征組合(2)(30維的Opponent顏色直方圖串聯(lián)15維的LBP紋理特征)表現(xiàn)最為突出,,AUC達(dá)到99.50%。在病灶區(qū)域識(shí)別階段,,特征組合(5)(30維LBP紋理特征串聯(lián)45維的RG和45維的Opponent顏色特征)表現(xiàn)出色,,AUC達(dá)到93.34%。本方法最終采用以上兩種最優(yōu)特征組合方式,,為后續(xù)的去除干擾和病灶識(shí)別工作奠定了基礎(chǔ),。
1.3 分類器設(shè)計(jì)
Adaboost衍生于Boosting算法,自從Schapire提出以來得到了廣泛的應(yīng)用,。Adaboost屬于一種迭代算法,,其核心思想是將多個(gè)弱分類器組合成一個(gè)強(qiáng)分類器。本文選取決策樹作為子分類器,,為避免過度學(xué)習(xí)的情況發(fā)生,,本文將樹的深度設(shè)置為2。其次需要確定算法迭代的次數(shù),,綜合考慮算法的識(shí)別率及分類器的訓(xùn)練時(shí)間,,最終確定迭代次數(shù)為60最為合適。
為減少胃鏡圖像中噪聲對(duì)檢測結(jié)果的影響,,本文方法將兩個(gè)Adaboost分類器串聯(lián)起來,,形成一個(gè)三分類器,通過此分類器,,待檢測區(qū)域?qū)⒈蛔R(shí)別為正常區(qū)域,、干擾區(qū)域或病灶區(qū)域3類,。其工作流程如圖4所示。
2 方法實(shí)現(xiàn)
首先,,采用超像素的思想將圖像分割成像素相對(duì)緊湊一致的區(qū)域,;其次,通過實(shí)驗(yàn)分別找出適用于干擾區(qū)域和病灶區(qū)域的特征的組合,;最后,,采用二級(jí)分類器完成干擾區(qū)域的去除以及病灶區(qū)域的識(shí)別工作。本文方法的整個(gè)流程下,。
算法:
?。?)設(shè)置期望的分割塊數(shù)K及區(qū)域的矩形度m。
?。?)在邊長為S的區(qū)域內(nèi)隨機(jī)初始化起始聚集中心CK=[lk,,ak,bk,,xk,,yk]T。
?。?)采用3×3大小的鄰域?qū)ふ姨荻茸钚〉狞c(diǎn)作為聚集中心點(diǎn),。
(4)repeat
?。?)for對(duì)于每一個(gè)中心點(diǎn)CK do
?。?)利用式(2),在中心點(diǎn)周圍2S×2S范圍內(nèi)尋找與中心點(diǎn)最匹配的像素點(diǎn),。
?。?)end for
(8)重新計(jì)算中心點(diǎn)的位置,,并計(jì)算新中心點(diǎn)與前中心點(diǎn)位置坐標(biāo)的歐式距離E,。
(9)until E≤threshold
?。?0)將孤立存在的小區(qū)域強(qiáng)制劃分到相鄰的最大區(qū)域,。
(11)for每一個(gè)分割后的區(qū)域do
?。?2)if區(qū)域內(nèi)像素個(gè)數(shù)≥N then
?。?3)提取適合于干擾區(qū)域識(shí)別的特征組合。
?。?4)利用第一級(jí)分類器進(jìn)行識(shí)別,。
(15)if該區(qū)域被識(shí)別為干擾區(qū)域then
(16)提取適合于病灶區(qū)域識(shí)別的特征組合,。
?。?7)利用第二級(jí)分類器進(jìn)行識(shí)別。
?。?8)end if
?。?9)end if
(20)end for
3 實(shí)驗(yàn)與結(jié)果分析
3.1實(shí)驗(yàn)設(shè)計(jì)
本實(shí)驗(yàn)的數(shù)據(jù)來源于120個(gè)臨床病例,,共計(jì)3 000張醫(yī)學(xué)胃鏡圖像,,其中包含1 500張含有病灶區(qū)域的圖像和1 500張完全健康的圖像。圖像的大小為489像素×409像素,,存儲(chǔ)格式為JPEG,。每一幅含有病灶區(qū)域的圖像都配有專業(yè)醫(yī)師標(biāo)注的標(biāo)注圖,在實(shí)驗(yàn)中作為地面真值,。
在實(shí)驗(yàn)中,規(guī)定對(duì)于完全健康的圖像,,只要有一個(gè)區(qū)域被識(shí)別為病灶區(qū)域,,則認(rèn)為檢測失敗,;反之,,則認(rèn)為檢測成功。對(duì)于含有病灶區(qū)域的圖像,,只要有識(shí)別為病灶的區(qū)域與醫(yī)生標(biāo)注區(qū)域有重疊,,則認(rèn)為檢測成功;否則,,認(rèn)為檢測失敗,。
在實(shí)驗(yàn)中,采用4種不同的方法對(duì)相同一批圖像進(jìn)行檢測,,用來進(jìn)行檢測效果的分析對(duì)比,。方法1,SLIC分割+組合特征+二級(jí)串聯(lián)分類器,;方法2,,SLIC分割+組合特征+單級(jí)分類器;方法3:按30×30矩形分割圖像+組合特征+二級(jí)串聯(lián)分類器,;方法4:按30×30矩形分割圖像+組合特征+單級(jí)分類器,。
3.2 實(shí)驗(yàn)結(jié)果與分析
本文采用ROC曲線對(duì)實(shí)驗(yàn)進(jìn)行分析。ROC曲線將靈敏度與特異性以圖示方法結(jié)合在一起,,可以準(zhǔn)確反映分析方法中特異性和敏感性的關(guān)系,,是試驗(yàn)準(zhǔn)確性的綜合代表。在ROC曲線圖表中,X軸表示假陽性率FPR(False Positive Rate),,Y軸表示真陽性率TPR(True Positive Rate),。ROC曲線展示了當(dāng)評(píng)判標(biāo)準(zhǔn)變化時(shí)這兩個(gè)變量之間的相互關(guān)系。ROC曲線下方的面積可以用來評(píng)判一個(gè)系統(tǒng)性能的好壞[5],。
實(shí)驗(yàn)結(jié)果如圖5所示,,本文所提出的方法(方法1)的檢測效果遠(yuǎn)好于其他方法,其正確率遠(yuǎn)好于其他3種方法,,正確率(AUC)達(dá)到91.588%,。方法2、方法3和方法4的正確率(AUC)分別為86.058%,、76.458%和70.727%,。
部分實(shí)驗(yàn)效果如圖6所示,其中第1排為含有病灶區(qū)域的胃鏡圖像,;第2排為臨床醫(yī)師給出的地面真值圖,;第3排為本文方法檢測后的結(jié)果圖。
醫(yī)療器械的限制以及胃部特殊生理環(huán)境的影響,,使得有些病灶區(qū)域很難用肉眼識(shí)別,。考慮到胃鏡圖像的成像質(zhì)量受多方面因素的影響,,圖像噪聲多的特點(diǎn),,本文方法在預(yù)處理階段采用SLIC分割算法,將圖像分割成大小均勻的超像素,,相較于簡單的人工劃分區(qū)域,,具有區(qū)域內(nèi)像素更加統(tǒng)一和緊湊的特點(diǎn)。此外,,本文方法還采用了多種特征組合的形式替代了單一特征,。最后通過使用二級(jí)串聯(lián)分類器將去干擾和病灶檢測步驟串聯(lián)進(jìn)行。實(shí)驗(yàn)表明,,本文方法的病灶檢測正確率優(yōu)于傳統(tǒng)方法,。
參考文獻(xiàn)
[1] Liang Pan, Cong Yang,, Guan Mo. A computer-aided lesion diagnose method based on gastroscope image[C]. 2012 IEEE International Conference on Information and Automation,, ICIA 2012, Washington,, DC. IEEE Computer Society,, 2012: 871-875.
[2] SZCZYPINSKI P, KLEPACZKO A,, PAZUREK M,, et al. Texture and color based image segmentation and pathology detection in capsule endoscopy videos[J]. Computer Methods and Programs in Biomedicine, 2014,13(1):396-411.
[3] LI B,, MENG M Q H. Tumor CE image classification using SVM-based feature selection[C]. Intelligent Robots and Systems (IROS),, 2010: 1322-1327.
[4] ACHANTA R, SHAJI A,, SMITH K,, et al. Slic superpixels[J]. Ecole Polytechnique Federal de Lausssanne(EPFL), Technical Report,, 2010: 149300.
[5] SWETS J A,, DAWES R M, MONAHAN J. Psychological science can improve diagnostic decisions[J]. Psychological Science in the Public Interest,, 2000,, 1(1): 1-26.