瑞薩電子與Syntiant共同開發(fā)結(jié)合先進視覺與語音技術(shù)的 語音控制多模態(tài)AI解決方案
2021-07-28
來源:瑞薩電子
2021 年 7 月 28 日,,日本東京和美國加州爾灣訊 - 全球半導體解決方案供應商瑞薩電子集團(TSE:6723),,和致力在邊緣設(shè)備領(lǐng)域推動低功耗智能語音及傳感器處理技術(shù)的深度學習芯片技術(shù)供應商Syntiant今日宣布,共同開發(fā)出一款語音控制的多模態(tài)AI解決方案,,在基于視覺AI的物聯(lián)網(wǎng)和邊緣系統(tǒng)(如自助收銀機,、安全攝像頭和視頻會議系統(tǒng))以及智能家電(如掃地機器人等)中實現(xiàn)低功耗,、非接觸式的圖像處理。
全新解決方案結(jié)合了瑞薩RZ/V系列視覺AI微處理器(MPU)和低功耗多模態(tài),、多功能Syntiant NDP120 Neural Decision Processor?,,以提供先進的語音和圖像處理功能,。該解決方案具備常開功能,可從待機模式快速通過語音激活,,以執(zhí)行物體識別,、面部識別等視覺任務,以及其它安防攝像機等系統(tǒng)的關(guān)鍵功能,。如當用戶定義的語音提示激活并運行系統(tǒng)時,,視覺AI將識別跟蹤操作員的行為,并控制操作或在檢測到可疑行為時發(fā)出警告,。
多模態(tài)架構(gòu)使得為基于視覺AI的系統(tǒng)創(chuàng)建非接觸式用戶體驗變得更加容易,。由于可以獨立于視覺AI功能進行軟件開發(fā),因此利用專用的高能效芯片進行語音識別可降低待機功耗,,并加速系統(tǒng)開發(fā),。
瑞薩電子高級副總裁、物聯(lián)網(wǎng)及基礎(chǔ)設(shè)施事業(yè)本部SoC事業(yè)部部長新田啟人表示:“我們預計,,作為提高易用性和安全性的一種有效途徑,,對采用多輸入信息流(包括圖像和語音)的多模態(tài)系統(tǒng)需求將會增加。擁有先進低功耗圖像AI技術(shù)的瑞薩與語音AI技術(shù)優(yōu)秀供應商Syntiant緊密合作,,將加速低功耗,、超小型智能語音AI技術(shù)在嵌入式系統(tǒng)中的應用,并為全球客戶帶來新的綜合解決方案,?!?/p>
Syntiant CEO Kurt Busch表示:“基于語音的用戶界面讓客戶獲得全新用戶體驗,將下一代創(chuàng)新理念從概念變?yōu)楝F(xiàn)實,。我們的深度學習NDP全球出貨量已超過1500萬片,,為各類消費和工業(yè)物聯(lián)網(wǎng)應用實現(xiàn)了常開語音功能。我們同瑞薩的合作打造了強大,、低功耗的語音及圖像解決方案,,相信它將會加速推動全球客戶在豐富設(shè)備和案例中的應用?!?/p>
用于視覺AI的瑞薩RZ/V系列MPU集成了瑞薩獨有的DRP-AI(動態(tài)可配置處理器-AI)加速器,,并將高精度AI推理與業(yè)界領(lǐng)先能效充分結(jié)合。卓越能效可消除對散熱片或冷卻風扇等散熱措施的需求,,從而降低材料清單(BOM)成本,,使視覺AI集成至廣泛的嵌入式應用成為可能。
Syntiant NDP120芯片集成了復雜的AI功能,,可用于眾多高精度免提語音應用,,包括演講人識別、關(guān)鍵詞檢測,、多喚醒詞和本地命令識別等,。NDP120與Syntiant Core 2?神經(jīng)網(wǎng)絡推理引擎封裝,,還可同時運行多個應用程序,并將功耗降至1mW電池功率,。
全新語音控制多模態(tài)AI解決方案作為瑞薩電子“成功產(chǎn)品組合”的一部分,,從瑞薩更廣泛的產(chǎn)品組合中選取多個相互兼容的器件,為客戶構(gòu)建更高階的原型設(shè)計平臺,,以加速上市并降低風險,。瑞薩“成功產(chǎn)品組合”包含卓越的模擬、電源和嵌入式處理產(chǎn)品組合,,可幫助客戶加速設(shè)計并縮短上市時間。
供貨信息
全新多模態(tài)AI解決方案的參考設(shè)計現(xiàn)已推出,,其中包括電路圖和BOM清單,。