智能語音作為入口已滲透到了很多領(lǐng)域,,從智能音箱到智能臺燈,,從智能家電到汽車的智能中控、后視鏡,,以及工業(yè)或陪伴式機(jī)器人,,智能語音可在消費(fèi)、汽車,、教育,、工業(yè)等各個(gè)領(lǐng)域開花結(jié)果。
所謂的智能語音就是給語音加了“大腦”,,讓其理解用戶通過語音表達(dá)出來的意圖和需求,,并且可以把對應(yīng)的內(nèi)容返回給用戶。
“現(xiàn)階段,,智能語音的落地主要受消費(fèi)電子市場激烈的競爭格局所驅(qū)動,,各廠商都期望賦予產(chǎn)品新賣點(diǎn)與新亮點(diǎn)。語音在消費(fèi)市場尤為火熱,,除了蘋果,、谷歌、亞馬遜等行業(yè)巨頭紛紛入場之外,還存在眾多跟風(fēng)者,。而其它領(lǐng)域,,如汽車電子、工業(yè)醫(yī)療等,,由于行業(yè)門檻或需求不集中等原因,雖被看好但仍需一定時(shí)間才能被市場接受,?!?nbsp;意法半導(dǎo)體模擬、微電機(jī)產(chǎn)品部市場經(jīng)理倪明如是說,。
意法半導(dǎo)體模擬,、微電機(jī)產(chǎn)品部市場經(jīng)理倪明
市面上有很多智能語音方案,背后的關(guān)鍵技術(shù)是硬件,、算法以及云服務(wù),。
倪明介紹道:“意法半導(dǎo)體在硬件上有自己的特色,能夠提供市場上應(yīng)用很普遍的STM32系列MCU作為主控,,再加上2顆或4顆硅麥克風(fēng)組成麥克風(fēng)陣列,;在聲學(xué)算法方面,意法半導(dǎo)體可提供Beam Forming (語音指向),、Sound Localization (聲源定位),、Echo Cancelation (回聲消除) 這些聲學(xué)前端算法,后端的聲學(xué)算法如本地,、云端的語音識別,,將由第三方合作伙伴 (如Sensory、科大訊飛等) 來提供,?!?/p>
對于近場語音識別,比如智能穿戴,、陪伴式機(jī)器人,,上述意法半導(dǎo)體方案即可滿足需求;對于遠(yuǎn)場的語音識別,,比如智能音箱,,意法半導(dǎo)體將負(fù)責(zé)語音前端處理,AP或DSP的第三方算法將負(fù)責(zé)后端處理,,因此需要與高通等后端AP廠商配合實(shí)現(xiàn),。
倪明表示:各廠商的智能語音方案都獨(dú)具特色,現(xiàn)有的語音方案在功能上基本滿足了市場的需求,,但可擴(kuò)展性及性能仍有改進(jìn)空間,。比如使用者會經(jīng)常遇到聽不到、聽不清的情況,語音產(chǎn)品易被干擾且存在功耗大等問題,。解決這些問題需要系統(tǒng)各方面的共同改進(jìn),。意法半導(dǎo)體本著開放的態(tài)度與行業(yè)各方合作共贏。
倪明指出理想的應(yīng)用或產(chǎn)品應(yīng)該是“按需分配”:即根據(jù)用戶或市場的需求,,系統(tǒng)可以做出適當(dāng)?shù)娜∩崤c調(diào)整,。與此同時(shí),倪明介紹了意法半導(dǎo)體在理想化產(chǎn)品道路上做出的努力:
作為系統(tǒng)基礎(chǔ)的硬件,,硅麥克風(fēng)至關(guān)重要,。意法半導(dǎo)體在提高其本體性能方面,將SNR提高到65~67dB,、 AOP提高到135dBSPL,,以及在麥克風(fēng)ASIC電路中加入抗干擾的設(shè)計(jì)等;
在意法半導(dǎo)體Beamforming算法庫中有4種針對不同應(yīng)用場景的模式供選擇,,既有適用于智能穿戴等語音方向較確定的場景下強(qiáng)指向模式 (Strong) ,,也有適用于語音方向范圍較寬、環(huán)境噪聲較大場景下的消噪模式 (Cardioid denoise) ,;
在功耗方面,,意法半導(dǎo)體新發(fā)布的MP23DB01HP數(shù)字硅麥克風(fēng)可以支持低功耗模式,該模式下麥克風(fēng)的功耗還不到正常模式的一半,,極大地提高了系統(tǒng)的持續(xù)工作時(shí)間,。例如手機(jī)穿戴產(chǎn)品中需要集成度更高、更加低功耗的方案,,意法半導(dǎo)體正在與合作伙伴研發(fā)將麥克風(fēng)與DSP合二為一的芯片“Smart MIC”,,該芯片將大大節(jié)約PCB布板空間及系統(tǒng)功耗。