摘? 要: 介紹了一種基于專用語音識別芯片TSG410的彩電智能聲控選臺系統(tǒng),,可以在不對彩電做任何改動的基礎(chǔ)上,,實現(xiàn)語音遙控電視機。
關(guān)鍵詞: 語音識別? 彩電遙控? 智能聲控選臺
?
隨著電視頻道數(shù)目的日益增多,,傳統(tǒng)的電視遙控方法弊端越來越明顯,。它需要觀眾記憶大量電視臺對應(yīng)頻道,,這是件很令人頭疼的事情,。我們利用專用語音識別芯片TSG410設(shè)計了一個彩電智能聲控選臺系統(tǒng),可以較好地解決記憶頻道這個難題,。尤其對殘疾朋友來講,,更具有特殊的意義,。
該系統(tǒng)不對彩電做任何改動。在保留原有遙控功能的基礎(chǔ)上,,實現(xiàn)語音控制選臺,,主要功能有:
·開關(guān)電視:電視接通電源處于待命狀態(tài),操作者發(fā)出“開機”命令,,則打開電視機;操作者發(fā)出“關(guān)機”命令,,則關(guān)掉電視機;
·選臺功能:操作者想看XX電視臺的節(jié)目,只要發(fā)出“XX臺”的命令,,電視機自動跳轉(zhuǎn)到該臺,。
·識別主人功能:為防止誤操作,該系統(tǒng)只對事先錄入命令樣本的操作者語音敏感,,其他人發(fā)出的命令包括電視伴音均無效,。
·其它功能:具有電視音量、畫面亮度調(diào)節(jié)等適合語音控制的功能,。
1 系統(tǒng)設(shè)計方案
我們最初考慮了兩種設(shè)計方案(見圖1和圖2),,它們各有優(yōu)缺點。第一種電路不足之處是:電路稍復雜一點,,而且要對電視機的選臺控制電路做必要的改動(當然這對電視機生產(chǎn)廠家是不成問題的);其優(yōu)點是:只需一個無線話筒便可聲控選臺,,且不必對準電視機,甚至在另一個房間也可實現(xiàn)遙控,。第二種電路的優(yōu)點是:不必對電視機的選臺控制電路做任何的改動;缺點是:所有電路只能靠電池供電,,芯片選擇要考慮耗電和工作電壓問題。由于采用紅外遙控發(fā)射來控制電視,,該系統(tǒng)須對準電視機才能正常工作,。綜合考慮各方面因素,我們認為第二種設(shè)計方案較切實可行,。
?
?
2 各個功能模塊簡介
2.1 語音命令提取單元
語音命令提取該單元(如圖2)在電視話音和其它噪音背景下,,完成提取出操作者語音命令功能,其示意圖如圖3所示,。
MIC選用駐極體送話器,,它具有結(jié)構(gòu)簡單、重量輕,、體積小,、頻率響應(yīng)寬、保真度好等優(yōu)點,,但靈敏度較低,,必須再加放大器才行。由于輸出阻抗可高達108Ω數(shù)量級,所以必須進行阻抗變換后才能與放大器配合使用,。放大器采用差分放大電路,,一個駐極體送話器面對送話者,其輸出接放大器正向輸入端;另一個駐極體送話器背對送話者,,其輸出接放大器負向輸入端,。由于兩個送話器相對于電視機和其它噪聲源的位置基本一樣遠,可以近似認為通過二者輸入的干擾是一樣的,。但考慮到送話器具有方向性,,前者送入的操作者語音命令遠遠大于后者,適當選擇各電阻值可以抵消掉各種干擾,。放大器采用運放(OP Amps)MAX495(單電源供電+2.7V~+6V),。
2.2 語音識別單元
語音識別單元主要由TSG410和非易失性SRAM組成,大體構(gòu)成如下圖4所示,。
?
語音識別功能由專用語音芯片TSG410完成,,TSG410是一種新穎功能齊全的語音識別集成電路。它采用CMOS大規(guī)模集成電路制作工藝制造,,內(nèi)含除SRAM以外語音識別所需的全部電路,,如CPU、A/D轉(zhuǎn)換器,、ROM,、語音放大器、壓縮器,、濾波器,、振蕩器及接口電路等。TSG410具有雙列直插和貼片兩種封裝方式,,可工作在CPU控制和人工控制兩種模式下,。語音識別的響應(yīng)時間典型值為300ms,最長不超過600ms,。
識別容量大,,最多可識別40個字段,且分段方式靈活,。為了CPU管理方便,,將40個字段分成四組,編號為1~4,,每組10個字段,。這樣,第一個字段編號為10,,第二個為11,,第三個為12…依次類推,,第40個字段編號為49。在操作顯示時,,十位數(shù)顯示組號,,個位數(shù)顯示序號,。因此,,建立語音樣本時,應(yīng)注意顯示數(shù)字和電視機選擇頻率之間的換算關(guān)系,,以免語音命令和控制結(jié)果對應(yīng)不起來,。各段功能分配如表1所示。
?
TSG410的每個字段時間長度可以在0.9s和1.92s之間選擇,。按正常人的講話速度,,每秒吐字2~4個,如選擇0.9s,,則每個命令字段以1~3個字為宜,,選擇1.92s則最大容量為8個漢字,但可識別的字段數(shù)減少為20個,。我們選擇前一種分段方式,,語音命令以3個字以下為宜。因此,,電視選臺命令采用“地方”命名原則,,如:山東、上海等,,中央臺可直接叫“一臺”,、“二臺”,依次類推,。語音命令差別越大越不容易出現(xiàn)錯誤識別,。系統(tǒng)要正常工作,必須首先建立語音樣本,,為防止語音樣本因為掉電丟失,,SRAM選用內(nèi)帶掉電保護電池的非易失性SRAM,即NVSRAM(non-volatile SRAM),,如HK1125,,掉電后其數(shù)據(jù)可保存10年以上,用法同普通RAM,。
一般情況下,,留有30個預選頻道是足夠用的。實際上,,既可以采用多片TSG410進行頻道數(shù)和允許操作者人數(shù)擴展方式滿足各種需要,,也可以采用讓TSG410工作在CPU控制方式的辦法。此時識別容量不受40字段限制,但需增加單片機(如8031)作控制用,。
2.3 控制面板
為了能輸入字段號,,以便建立語音樣本,TSG410配置了外接鍵盤掃描電路,。行,、列信號的輸入、輸出口由芯片的S1~S3,、K1~K3擔當,。這樣一個三列、四行的鍵盤共有12個按鍵,,其中十個定義為:0~9數(shù)字鍵,,一個定義為:語音樣本建立鍵(TRN),一個定義為:語音樣本清除鍵(CLR),。由于控制面板只在建立語音樣本時使用,,為防止誤操作,應(yīng)將12個按鍵用塑料外殼封起來,。
2.4 操作指示電路
采用兩片數(shù)碼管和譯碼驅(qū)動電路CC4558組成操作指示電路,。在本系統(tǒng)中,操作指示電路的作用是:建立語音命令樣本時,,用于顯示存入的字段號;語音命令識別時用于顯示識別結(jié)果及芯片識別結(jié)果的處理報告,。
2.5 邏輯控制電路
整個邏輯控制電路如圖5所示。TSG410通過D0~D7輸出識別結(jié)果,,必須進行必要的譯碼后,,才能用來控制后面的紅外發(fā)射裝置。在電視機的遙控系統(tǒng)中,,遙控發(fā)射器通過按鍵,,以紅外線方式發(fā)出各種不同的脈沖編碼信息。尤其需要注意其發(fā)射編碼必須與原來一致,,以便兼容,。采用電子開關(guān)電路模擬手工按鍵時,必須考慮開關(guān)接通時間和兩個按鍵之間的時間間隔問題,,以防止信號丟失和“串鍵”,、“并鍵”現(xiàn)象的發(fā)生。通常情況下,,全部鍵位掃描一次的時間小于10~20ms,,而人手觸及按鍵的時間最短也在100ms以上,因此在任一按鍵被按下后,,會有多次掃描信號通過,,不存在信號丟失問題,。所謂“串鍵”是指在一個鍵按下之后,又接著按下另一鍵;而“并鍵”則是同時按下兩鍵,。這兩種錯誤操作發(fā)生的根本原因是:每個按鍵的遙控指令編碼需要一定時間才能發(fā)射完畢(一般在100ms左右),,所以應(yīng)設(shè)法消除。這是我們設(shè)計邏輯控制電路時的一個難點,,采用脈沖展寬(>40ms)和脈沖延遲電路(>120ms)解決,。
?
2.6 遙控發(fā)射電路
紅外遙控發(fā)射器主要由三大部分組成:一是鍵盤矩陣,二是發(fā)射專用集成電路,,三是放大驅(qū)動和紅外線發(fā)射部分,。該電路與電視機的特定型號有關(guān),,可以根據(jù)電視機品牌選用適當?shù)膶S眉t外發(fā)射電路,。
需要說明的是:由于不同品牌電視機的紅外發(fā)射、接收電路各不相同,,因此它只對兼容電視有效,。
?
參考文獻
1 孫景琪.遙控彩色電視機集成電路及應(yīng)用.北京:人民郵電出版社,1994
2 TSG公司.TSG410芯片數(shù)據(jù)資料
3 MAXIM公司.1996 NEW RELEASES DATA BOOK