《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 業(yè)界動態(tài) > 基于DSP的廣播節(jié)目自動識別系統(tǒng)的實現(xiàn)

基于DSP的廣播節(jié)目自動識別系統(tǒng)的實現(xiàn)

2009-01-05
作者:鄭仁富,,劉 杰

??? 摘 要: 本系統(tǒng)針對廣播節(jié)目信號傳輸時易受干擾的問題,,采用相關(guān)系數(shù)算法判別廣播音頻信號的相似性,實現(xiàn)在高速數(shù)字信號處理器(DSPs)芯片上對輸入的多路節(jié)目信號進行自動識別,并分析其實現(xiàn)原理,。實驗結(jié)果表明了系統(tǒng)的正確性和合理性,。
??? 關(guān)鍵詞: 相關(guān)系數(shù);音頻信號,;DSP6713,;語音識別

?

??? 目前,國內(nèi)廣播中心節(jié)目傳輸系統(tǒng)是將其所有播出節(jié)目通過傳輸系統(tǒng)送往發(fā)射中心和其他目的地,。傳輸方式有地面無線,、光纖、微波中繼及衛(wèi)星傳輸?shù)?。音頻廣播節(jié)目通過這四種傳輸方式傳輸?shù)綇V播發(fā)射機房供發(fā)射機選擇使用,。然而,現(xiàn)今的轉(zhuǎn)播選擇控制過程都要依靠人為來實現(xiàn),,既浪費了人力物力,,又容易出現(xiàn)誤操作。特別在無人看守的情況下,,一旦出現(xiàn)惡意攻擊節(jié)目信號的事件,,后果將難以估計。
??? 在通常情況下,,每個信道同時受到攻擊的可能性很小,一般是某個信道受到攻擊或干擾,。因此,要把接收到的四路信號進行兩兩比較,。若四路信號都為同一信息,,則說明四路都沒被攻擊,;若有一路或兩路信號與其他路信號不同,,即可判為被惡意攻擊的信號。
??? 本系統(tǒng)利用瑞泰公司的ICETEK-C6713-A評估板支持多路輸入輸出的特性,,同時對四路廣播節(jié)目信號進行采集,,然后對采集到的四路信號進行同步,,再通過相關(guān)系數(shù)算法,對其兩兩的相似性作判決,,最終選出一路最佳信號,,并做出相應(yīng)操作。該系統(tǒng)從保證節(jié)目安全播出的角度出發(fā),,能夠?qū)V播節(jié)目進行自動識別,,可應(yīng)用于廣播節(jié)目自動識別系統(tǒng),提高廣播機房工作的有效性,、可靠性,、安全性。
1 識別算法的實現(xiàn)
1.1 互相關(guān)算法

??? 互相關(guān)處理是信號檢測中常用的方法,,即求兩個信號的相似程度,,當(dāng)兩個信號出現(xiàn)互相關(guān)性時會產(chǎn)生峰值,而無相關(guān)性信號將被大幅度衰減,,從而判斷出被噪聲淹沒的兩路信號的相似程度,。這是因為信息有良好的時間相關(guān)性(即信號是積累的),而噪聲是隨機的,,沒有時間相關(guān)性(即噪聲不積累),。假設(shè)x(t)為一路信號,y(t)為另一路信號,,n(t)為噪聲,,則s(t)=x(t)+n(t)為被噪聲干擾的信號。則它們的互相關(guān)函數(shù)為:
????
??? 由于廣播節(jié)目信號與環(huán)境的隨機噪聲沒有相關(guān)性,,所以Rny(τ)=0,,故Rsy(τ)=Rxy(τ),可以排除環(huán)境的隨機噪聲對系統(tǒng)識別的影響,。因此,,只要根據(jù)Rxy(τ)的值,就能判斷出接收到的兩路信號是不是同一信號,,即有沒有受到惡意攻擊,。可以設(shè)一個門限K來判斷,,若Rxy(τ)>K,,則認(rèn)為這兩路信號有相關(guān)性,判為同一信號,;否則判為不同信號,。
??? 但是在實際應(yīng)用中,由于信號的不同或噪聲等其他因素的影響,,Rxy(τ)值的波動太大,,所以K的值很難確定,。針對該問題,本系統(tǒng)采用求兩路信號的相關(guān)系數(shù)ρ的絕對值來解決,,因為ρ取值范圍介于-1~1之間,。ρ>0為正相關(guān),ρ<0為負(fù)相關(guān),,ρ=0表示不相關(guān),;ρ的絕對值越大,相關(guān)程度越高,。ρ的計算公式如下:
???
1.2 算法可行性在MATLAB上的驗證
??? 首先,,通過麥克風(fēng)錄音,隨便保存好幾個音頻信號,,用于下面的語音識別,,如本實驗中,錄入由筆者念的“1”,、“2”,、“福州大學(xué)”、“信息工程”等音頻信號,;接著通過MATLAB打開音頻信號,,加入噪聲,再找出信號間的相關(guān)性,,并畫出波形圖,。實驗結(jié)果如圖1所示。

?


??? 在圖1中,,信號一和信號二的信號內(nèi)容都是筆者自己錄制的“福州大學(xué)”四個字的音頻信號,,相關(guān)性為這兩個信號在加噪后(信噪比為25dB)求出的互相關(guān)程度。其中在X軸為3841的位置有明顯的波峰,,峰值為205.8,。
??? 在圖2中,信號一的信號內(nèi)容是筆者自己錄制的“福州大學(xué)”四個字的音頻信號,,而信號二的信號內(nèi)容都是 “信息工程”四個字的音頻信號,,其中相關(guān)性也是這兩個信號在加噪后(信噪比為25dB)求出的互相關(guān)程度。圖中沒有明顯的波峰,,且相關(guān)性大小幅值明顯偏?。ㄆ浞底畲笾禐?.947)。
??? 從圖1與圖2可以看出,,相同信號在噪聲的影響下具有較大的相關(guān)性,,而不同信號之間的相關(guān)性非常小,從而說明了該算法的可行性,。

?


1.3 算法在DSP上的實現(xiàn)
??? 本系統(tǒng)的主要算法是求兩信號的相關(guān)系數(shù),,由公式(2)可看出,相關(guān)系數(shù)的計算,,其實就是用兩信號的互相關(guān)性除以各信號的自相關(guān)的乘積的平方根,。因此,求一次相關(guān)系數(shù)就等于求三次互相關(guān)性,,如式(1),。
??? 利用DSP6713的浮點運算功能的優(yōu)勢,用快速傅立葉(FFT)來計算兩信號的互相關(guān)性[1],。其步驟如下:
??? (1)假設(shè)截取的用來識別的信號長度為M,,則選擇FFT的變換長度L應(yīng)滿足如下條件:
????
??? (2)將截取的音頻信號x(n)、y(n)也按如下方式補零,,形成長度有L的序列:
???
??? (3)用FFT算法分別計算信號序列的離散傅立葉變換X(k)和Y(k):
?????
??? (4)計算X(k)和Y(k)的乘積: Z(k)=X*(k)Y(k),,其中*表示復(fù)共軛。
??? (5)用FFT算法計算Z(k)離散傅立葉反變換,,得到相關(guān)性z(n):
????
2 系統(tǒng)設(shè)計與實現(xiàn)
????本系統(tǒng)主要基于TMS320C6713實現(xiàn)廣播中心的自動識別,,它是基于語音識別技術(shù)實現(xiàn)的?;咎幚砹鞒虨椋簩斎氲亩嗦芬纛l信號進行采集,,對得到的數(shù)據(jù)進行信號處理,用相關(guān)算法判別信號的相似性,,而后輸出控制信號對多路信號進行切換,,使輸出的數(shù)據(jù)具有最佳信噪比。系統(tǒng)框圖如圖3所示,。

?


2.1 節(jié)目信號的輸入
??? 本系統(tǒng)語音采集主要利用ICETEK-AIC23板上語音codec芯片TLV320AIC23實現(xiàn),。在語音輸入時利用了ICETEK-C6713-A EVM支持多路輸入輸出的特點。首先,,DSP通過I2C總線將配置命令發(fā)送到AIC23使其初始化,,等配置完成后AIC23開始工作。然后AIC23通過其中的AD轉(zhuǎn)換采集輸入的語音信號,,每采集完一個信號后,,將數(shù)據(jù)發(fā)送到DSP的McBSP接口上,DSP可以讀取到語音數(shù)據(jù),,每個數(shù)據(jù)為16位無符號整數(shù),,左右通道各有一個數(shù)值。
2.2 分幀
??? 從整體來看語音信號的特性及表征其本質(zhì)特征的參數(shù)均是隨時間而變化的,,是一個典型的非平穩(wěn)過程,,但是在一個短時間段內(nèi)(10ms~30ms的短時間段內(nèi))其特性保持相對穩(wěn)定,因而可以看作是一個準(zhǔn)平穩(wěn)過程,,即語音信號的短時平穩(wěn)性,。目前絕大多數(shù)的語音信號處理技術(shù)均是在“短時”的基礎(chǔ)上,,將語音信號分為許多段來逐段分析其特征參數(shù),其中每一段稱為一“幀”,,分段的過程稱為“分幀”處理,。根據(jù)不同的處理需求,選取不同的幀長,。通常,,幀長選取10ms~30ms(當(dāng)FS=22.050kHz時,,相應(yīng)于每幀有220~661個信號樣本值)。在取數(shù)據(jù)時,前一幀的尾和后一幀的頭交疊截取,,交疊部分稱為幀移,。幀移與幀長的比值一般取為0~1/2,。在端點檢測前,,選取幀長為240個信號樣本值,幀移為80個信號樣本值,。
2.3 迭加濾波
??? 由于語音信號具有短時平穩(wěn)性的特點,,即語音信號在30ms左右時間里基本保持不變,而噪聲則具有隨機性的特點,,不具備短時平穩(wěn)性的特點,,因此,本系統(tǒng)用迭加濾波的方法對輸入的廣播節(jié)目信號進行濾波,。迭加濾波的實現(xiàn)步驟如下:
??? (1)語音信號經(jīng)過采樣和量化后,,以N點為一幀,對一幀內(nèi)的N點進行累加,,設(shè)累加后的結(jié)果為SUM,。
?? ?(2)將這一幀內(nèi)的平均值(SUM/N)代替該幀的信號采樣值。
?? ?(3)重復(fù)步驟(2)的操作,,直到所有的幀均作平均處理,。
2.4 端點檢測
??? 語音的端點檢測就是確定語音的起點和終點,端點檢測的正確與否對語音識別的性能有很大的影響,,特別是對端點檢測比較敏感的語音識別算法,。漢語語音因為聲母都是清聲母,還有送氣與不送氣的塞音和塞擦音,,它們與環(huán)境噪聲難以分辨,。
??? 常用的端點檢測方法有過零檢測和短時能量檢測。本系統(tǒng)采用這兩種方法的綜合——雙門限端點檢測法來進行語音信號端點檢測,,檢測時,,先要分別為短時能量和過零率確定兩個門限。高門限被超過時,基本可以確定語音的起始端點,,低門限用于確定語音真正的端點,。低門限被超過未必就是語音的起始端點,也有可能是短時噪聲,。當(dāng)高門限已經(jīng)確定語音起始端點,,再返回去利用低門限確定語音的真正起始點,語音結(jié)束點的判別方法類似,。有時噪聲的能量也相當(dāng)大,,可能超過高門限,,但是噪聲一般持續(xù)時間比較短,,可以用持續(xù)時間來決定是噪聲還是語音。
2.5 識別判決與相應(yīng)動作
??? 因為光纖傳輸?shù)墓?jié)目受到惡意侵入的可能性比較小,,因此,,可以以這路信號為模板,將其他三路信號與該路信號比較,,判決其他三路信號是否遭到惡意侵入,。若沒有一路信號與其相同,則說明該路可能受到敵意攻擊,,則再選另一路做為模板來做判決,。
??? 經(jīng)過語音識別判決后,在已經(jīng)識別出的未受干擾的正常廣播節(jié)目信號中,,要選取一路最佳節(jié)目作為輸出,,即要尋找一路信噪比最高的信號。
??? 在這里,,通過計算信號的平均功率來進行判別,。具體步驟如下:
??? (1)讀取各路正常信號進行分幀后,計算每一幀的短時能量,;
?? ?(2)對各路信號均取其N幀的短時能量進行累加,;
?? ?(3)對它們累加后的結(jié)果取平均,便得到各路信號的平均功率,;
?? ?(4)根據(jù)各路信號的平均功率進行比較,,選擇平均功率最高的那路信號作為輸出。
2.6 實驗結(jié)果
??? 在ICETEK-C6713-A的硬件平臺下,,每次輸入兩路語音信號,,并給信號加噪聲(信噪比為13dB),然后對相同信號與不同信號之間進行判決,。各做了66次實驗,,其結(jié)果如表1所示。

?


??? 本系統(tǒng)采用相關(guān)性算法,結(jié)合TI公司高速的DSP浮點處理器TMS320C6713嵌入式硬件平臺,,實現(xiàn)對四路廣播節(jié)目的自動識別,。系統(tǒng)對提高廣播機房工作的有效性、可靠性,、安全性,,并最終實現(xiàn)無人看守方面有著重大意義。當(dāng)然,,系統(tǒng)處理速度和識別率等方面都有待于優(yōu)化,。
參考文獻
[1] 殷福亮,宋愛軍.數(shù)字信號處理C語言程序集[M].遼寧:遼寧科學(xué)技術(shù)出版社,,1997.
[2] 李方慧,,王飛.TMS320C6000系列DSPs原理與應(yīng)用[M].北京:電子工業(yè)出版社,2003.
[3] 何強,,何英.MATLAB擴展編程[M].北京:清華大學(xué)出版社,,2002.
[4] 胡廣書.數(shù)字信號處理理論、算法與實現(xiàn)[M].北京:清華大學(xué)出版社,,2003.
[5] 鄭君理,,應(yīng)啟衍,楊為理.信號與系統(tǒng)[M].北京:高等教育出版社,,2000.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]