《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 設(shè)計(jì)應(yīng)用 > 盲源分離技術(shù)及其發(fā)展
盲源分離技術(shù)及其發(fā)展
王春華,公茂法, 衡澤超
摘要: 盲源信號(hào)分離是一種功能強(qiáng)大的信號(hào)處理方法,在生物醫(yī)學(xué)信號(hào)處理、陣列信號(hào)處理、語(yǔ)音識(shí)別、圖像處理及移動(dòng)通信等領(lǐng)域得到了廣泛的應(yīng)用。簡(jiǎn)要介紹了盲源分離的數(shù)學(xué)模型、可實(shí)現(xiàn)性、可解的假設(shè)條件及算法,綜述了盲源分離的發(fā)展及研究現(xiàn)狀,提出了其未來(lái)的發(fā)展方向。
Abstract:
Key words :

  摘  要: 盲源信號(hào)分離是一種功能強(qiáng)大的信號(hào)處理方法,在生物醫(yī)學(xué)信號(hào)處理、陣列信號(hào)處理、語(yǔ)音識(shí)別圖像處理移動(dòng)通信等領(lǐng)域得到了廣泛的應(yīng)用。簡(jiǎn)要介紹了盲源分離的數(shù)學(xué)模型、可實(shí)現(xiàn)性、可解的假設(shè)條件及算法,綜述了盲源分離的發(fā)展及研究現(xiàn)狀,提出了其未來(lái)的發(fā)展方向。
  關(guān)鍵詞: 盲源分離;獨(dú)立分量分析;發(fā)展

   盲源分離BSS(Blind Source Separation)是信號(hào)處理中一個(gè)傳統(tǒng)而又極具挑戰(zhàn)性的問(wèn)題。BSS指僅從若干觀測(cè)到的混合信號(hào)中恢復(fù)出無(wú)法直接觀測(cè)的各個(gè)原始源信號(hào)的過(guò)程。這里的“盲”指源信號(hào)不可觀測(cè)、混合系統(tǒng)特性事先未知這兩個(gè)方面。在科學(xué)研究和工程應(yīng)用中,很多觀測(cè)信號(hào)都可以看成多個(gè)源信號(hào)的混合,所謂“雞尾酒會(huì)”[1]問(wèn)題就是一個(gè)典型的例子。其中獨(dú)立分量分析ICA(Independent Component Analysis)[2]是一種盲源信號(hào)分離方法,它已成為陣列信號(hào)處理和數(shù)據(jù)分析的有力工具,而B(niǎo)SS比ICA適用范圍更寬。目前國(guó)內(nèi)對(duì)盲信號(hào)分離問(wèn)題的研究,在理論和應(yīng)用方面也取得了很大的進(jìn)步,但是還有很多問(wèn)題有待進(jìn)一步研究和解決。
1 盲源分離基本理論
1.1  盲源分離的數(shù)學(xué)模型
  盲信號(hào)分離研究的信號(hào)模型主要有線性混合模型和卷積混合模型,盲源分離源信號(hào)線性混合是比較簡(jiǎn)單的一種混合形式,典型的BSS/ICA問(wèn)題就是源于對(duì)獨(dú)立源信號(hào)的線性混合過(guò)程的研究。
1.1.1  盲源分離的線性混合模型
  所謂的“雞尾酒會(huì)”問(wèn)題,具體描述是:在一個(gè)雞尾酒會(huì)現(xiàn)場(chǎng),如果用安放在不同位置的多個(gè)麥克風(fēng)現(xiàn)場(chǎng)錄音,則所記錄的信號(hào)實(shí)際上是不同聲源的混合信號(hào)。人們希望從這些混合錄音信號(hào)中把不同的聲源分離出來(lái),這顯然不是一件很容易的事,至少用傳統(tǒng)的頻域?yàn)V波方法行不通。因?yàn)椴煌曉葱盘?hào)的頻譜相互混疊在一起,無(wú)法有效地設(shè)計(jì)濾波器,但從頻譜的角度可以把不同聲源分離出來(lái)。根據(jù)以上描述,可以把盲源分離問(wèn)題表示為如圖1所示的線性模型。為簡(jiǎn)單起見(jiàn),暫時(shí)忽略時(shí)延、非線性等因素的影響,即最簡(jiǎn)單混合系統(tǒng)——線性瞬時(shí)混合系統(tǒng)。

 


  圖中虛線框中的源信號(hào)矢量s=(s1,s2,…,sN)T和線性混合矩陣H都是未知的,W為待求的分離矩陣,y=(y1,y2,…,yN)T是分離矩陣W的最終輸出結(jié)果。

  盲源分離的最終目的就是尋找分離矩陣W,使輸出信號(hào)y盡可能地逼近真實(shí)源信號(hào)s。顯然,如果知道了分離矩陣,此問(wèn)題就變成了非常簡(jiǎn)單的線性方程組的求解問(wèn)題。但混合H矩陣未知,且在沒(méi)有任何源信號(hào)的先驗(yàn)知識(shí)的情況下,源信號(hào)的恢復(fù)就成了非常困難的問(wèn)題,即盲源分離問(wèn)題。
1.1.2  盲源分離的卷積混合模型
  在實(shí)際系統(tǒng)中,傳感器接收到的信號(hào)往往是源信號(hào)經(jīng)過(guò)不同時(shí)延的線性組合,即觀測(cè)信號(hào)是源信號(hào)的卷積和,稱為線性卷積混合模型。這種混合模型更接近實(shí)際。
  假設(shè)N個(gè)統(tǒng)計(jì)獨(dú)立的源信號(hào)si(t),i=1,2,…,N,經(jīng)過(guò)卷積混合后被M個(gè)傳感器接收,混合信號(hào)為xj(t),j=l,2,…,M,則卷積混合的數(shù)學(xué)模型可以表示為:

  A為混合矩陣。當(dāng)L=l時(shí),該模型就退化為瞬時(shí)混合模型。
1.2 盲源分離的可實(shí)現(xiàn)性
  盲源分離的可實(shí)現(xiàn)性就是要研究在多大程度上混合矩陣H可以由觀測(cè)向量x(t)來(lái)辨識(shí)。如果一個(gè)方陣在每一行及每一列中有且僅有一個(gè)非零元素,則稱此方陣為非混合陣。如果C是一個(gè)非混合陣,則稱y(t)=Cs(t)是s(t)的一個(gè)拷貝。y(t)和s(t)的差異僅表現(xiàn)在各元素的排列順序及各元素的幅度值上。在盲源分離問(wèn)題中,由于沒(méi)有其他先驗(yàn)知識(shí),所以如果能得到源信號(hào)的一個(gè)拷貝,就可以說(shuō)完成了盲源分離的工作。
  下面討論為什么在觀測(cè)信號(hào)x(t)已知的情況下,僅僅根據(jù)“源信號(hào)之間是統(tǒng)計(jì)獨(dú)立的”就能得到源信號(hào)的一個(gè)拷貝。Dannois定理內(nèi)容如下:
  假設(shè)s(t)為一個(gè)各分量相互獨(dú)立的矢量(其中至多有一個(gè)高斯分量),C為一任意的可逆矩陣,如果y(t)=Cs(t)的各分量間也是統(tǒng)計(jì)獨(dú)立的,則y(t)就是s(t)的一個(gè)拷貝(即C是一個(gè)非混合矩陣)。
  從該定理中發(fā)現(xiàn),除非矩陣C是非混合陣,否則將把一個(gè)各分量t相互獨(dú)立的向量(至多有一個(gè)高斯分量)轉(zhuǎn)換成為一個(gè)各分量不相互獨(dú)立的向量。這一結(jié)論很關(guān)鍵,它意味著只要設(shè)法使模型中的輸出信號(hào)y(t)的各分量相互統(tǒng)計(jì)獨(dú)立,便可以實(shí)現(xiàn)信號(hào)的盲分離。算法的最終目的是使經(jīng)過(guò)分離矩陣之后的輸出信號(hào)的各分量間獨(dú)立性最大,以此為根據(jù)來(lái)調(diào)整分離矩陣的參數(shù),實(shí)現(xiàn)信號(hào)的盲分離。
1.3  盲源分離問(wèn)題的假設(shè)條件
  由于對(duì)源信號(hào)和混合矩陣無(wú)先驗(yàn)知識(shí)可以利用,為了使盲源分離問(wèn)題可解需對(duì)源信號(hào)和混合矩陣作某些假設(shè)。這些基本的假設(shè)條件[3]包括:
  (1)源信號(hào)向量s的各分量都是零均值的時(shí)隨機(jī)信號(hào),且在任意時(shí)刻均相互獨(dú)立;
  (2)最多只有一個(gè)源信號(hào)分量的概率密度函數(shù)是高斯分布;
  (3)混合矩陣H為可逆的或者列滿秩的,m≥n。
1.4  盲源分離算法
  瞬時(shí)線性混疊盲分離代表性的算法主要有Bell-Sejnowski最大信息量(Infomax)方法、Amari自然梯度(Natural Gradient)方法、Cardoso等變化自適應(yīng)方法(EASI)、Hyvarinen快速獨(dú)立元分析算法(FastICA)、矩陣特征值分解方法等。其他算法很多都是在這些算法的基礎(chǔ)上推廣或者補(bǔ)充發(fā)展起來(lái)的,當(dāng)然盲分離并不僅僅局限于這些算法。盲分離中經(jīng)常要用到優(yōu)化運(yùn)算,就優(yōu)化手段而言,Infomax算法、自然梯度算法和EASI算法屬于梯度下降(上升)尋優(yōu)算法,收斂速度是線性的,速度略慢一些,但屬于自適應(yīng)方法,具有實(shí)時(shí)在線處理能力;FastICA算法是一種快速而數(shù)值穩(wěn)定的方法,采用擬牛頓算法實(shí)現(xiàn)尋優(yōu),具有超線性收斂速度,通常收斂速度較梯度下降尋優(yōu)算法快得多;矩陣特征值分解盲分離方法通過(guò)對(duì)矩陣進(jìn)行特征分解或者廣義特征分解估計(jì)分離矩陣,是一種解析方法,可直接找到閉形式解,沒(méi)有迭代尋優(yōu)過(guò)程,因此運(yùn)行速度最快。
  相比瞬時(shí)線性混疊和卷積混疊盲分離,非線性混疊盲分離難度非常大,主要有自組織映射網(wǎng)絡(luò)方法、感知器模型法、徑向基函數(shù)網(wǎng)絡(luò)法、后非線性混疊盲分離幾類(lèi)方法。
2  盲源分離的發(fā)展及發(fā)展趨勢(shì)
  目前國(guó)際國(guó)內(nèi)對(duì)盲源分離問(wèn)題的研究工作仍處于不斷發(fā)展階段,新理論、新方法還在源源不斷地涌現(xiàn)。
2.1  盲源分離的發(fā)展
  1986年,法國(guó)學(xué)者Jeanny Herault和Christian Jutten提出了遞歸神經(jīng)網(wǎng)絡(luò)模型和基于Hebb學(xué)習(xí)律的學(xué)習(xí)算法,以實(shí)現(xiàn)2個(gè)獨(dú)立源信號(hào)混合的分離。這一開(kāi)創(chuàng)性的論文在信號(hào)處理領(lǐng)域中揭開(kāi)了新的一章,即盲源分離問(wèn)題的研究。
  其后二十幾年來(lái),對(duì)于盲信號(hào)分離問(wèn)題,學(xué)者們提出了很多的算法,每種算法都在一定程度上取得了成功。從算法的角度而言,BSS算法可分為批處理算法和自適應(yīng)算法;從代數(shù)函數(shù)和準(zhǔn)則而言,又分為基于神經(jīng)網(wǎng)絡(luò)的方法、基于高階統(tǒng)計(jì)量的方法、基于互信息量的方法、基于非線性函數(shù)的方法等。
  盡管?chē)?guó)內(nèi)對(duì)盲信號(hào)分離問(wèn)題的研究相對(duì)較晚,但在理論和應(yīng)用方面也取得很大的進(jìn)展。清華大學(xué)的張賢達(dá)教授在其1996年出版的《時(shí)間序列分析——高階統(tǒng)計(jì)量方法》一書(shū)中,介紹了有關(guān)盲分離的理論基礎(chǔ),其后關(guān)于盲分離的研究才逐漸多起來(lái)。近年來(lái)國(guó)內(nèi)各類(lèi)基金支持了盲信號(hào)處理理論和應(yīng)用的項(xiàng)目,也成立了一些研究小組。
2.2  盲源分離的發(fā)展趨勢(shì)
  雖然盲源分離理論方法在最近20年已經(jīng)取得了長(zhǎng)足的發(fā)展,但是還有許多問(wèn)題有待進(jìn)一步研究和解決。首先是理論體系有待完善。實(shí)際采用的處理算法或多或少都帶有一些經(jīng)驗(yàn)知識(shí),對(duì)于算法的穩(wěn)定性和收斂性的證明不夠充分。盲源分離尚有大量的理論和實(shí)際問(wèn)題有待解決,例如多維ICA問(wèn)題、帶噪聲信號(hào)的有效分離方法、如何更有效地利用各種先驗(yàn)知識(shí)成功分離或提取出源信號(hào)、一般性的非線性混合信號(hào)的盲分離、如何與神經(jīng)網(wǎng)絡(luò)有效地結(jié)合、源信號(hào)的數(shù)目大于觀察信號(hào)的數(shù)目時(shí)ICA方法等。另外,盲源分離可同其他學(xué)科有機(jī)結(jié)合,如模糊系統(tǒng)理論在盲分離技術(shù)中的應(yīng)用可能是一個(gè)有前途的研究方向;盲源分離技術(shù)與遺傳算法相結(jié)合,可以減少計(jì)算復(fù)雜度,提高收斂速度。如何有效提高算法對(duì)源信號(hào)統(tǒng)計(jì)特性的學(xué)習(xí)和利用也需要進(jìn)行深入研究。在硬件實(shí)現(xiàn)方面,盲分離問(wèn)題也存在著極大的發(fā)展空間,例如用FPGA實(shí)現(xiàn)等。
  經(jīng)過(guò)人們將近20年的共同努力,有關(guān)盲分離的理論和算法得到了較快發(fā)展,包括盲分離問(wèn)題本身的可解性以及求解原理等方面的基本理論問(wèn)題在一定程度上得到了解決,并提出了一些在分離能力、內(nèi)存需求、計(jì)算速度等方面性能各異的算法。由于該問(wèn)題的理論研究深度和算法實(shí)現(xiàn)難度都較大,目前對(duì)于盲分離的研究仍然很不成熟,難以滿足許多實(shí)際應(yīng)用需求,許多理論問(wèn)題和算法實(shí)現(xiàn)的相應(yīng)技術(shù)也有待進(jìn)一步探索。
參考文獻(xiàn)
[1] BELL A J, SEJNOWSKI T J.An information maximization approch to blind separation and blind deconvolution[J].Neural Computation,1995,7(6): 1004-1034.
[2] JUTTEN C, HERAULT J.Blind separation of source. Part I:An adaptive algorithm based on neuromimatic architecture[J]. Signal Processing, 1991,24(1):1-10.
[3] 馬建倉(cāng),牛奕龍,陳海洋.盲信號(hào)處理[M].北京:國(guó)防工業(yè)出版社,2003.

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。