《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 可編程邏輯 > 解決方案 > 對話云知聲副總裁李霄寒:從單模態(tài)到多模態(tài),以算法起家的AI芯片公司后勁十足

對話云知聲副總裁李霄寒:從單模態(tài)到多模態(tài),以算法起家的AI芯片公司后勁十足

2019-01-24

目前,物聯(lián)網(wǎng)人工智能(AI)都是發(fā)展大勢。而 AI 芯片正處于從通用型向?qū)S眯桶l(fā)展和轉(zhuǎn)化的過程當中,,特別是在物聯(lián)網(wǎng)邊緣側(cè),,通用型 AI 芯片的計算效率較低,,繼而帶來了成本和功耗的失配,。此外,,AI 芯片要面對很多不同場景,很難有一款通用型產(chǎn)品能滿足不同客戶的需求,。


目前來看,,有越來越多的專用型 AI 芯片或模組的案例涌現(xiàn)出來,如智能家居,、機器人,、智能音箱等,都對專用型 AI 芯片提出了越來越多的需求,。


因此,,當今做 AI 芯片是符合市場發(fā)展需求的,在這方面,,越來越多的公司更加務(wù)實,,將其作為長期的發(fā)展戰(zhàn)略,而不是抱著投機的心態(tài)去做 AI 芯片,。云知聲就是這樣一家本土企業(yè),。2018 年 5 月,該公司正式發(fā)布首款物聯(lián)網(wǎng)專用 AI 芯片之后,,不足半年的時間,,今年 1 月其再次對外宣布多模態(tài) AI 芯片的研發(fā)計劃。

微信圖片_20190124201144.jpg


物聯(lián)網(wǎng)芯片設(shè)計難在哪兒,?


隨著應(yīng)用的發(fā)展,,物聯(lián)網(wǎng)的場景化特點會愈加突出,此時,,只提供單一芯片已經(jīng)很難滿足客戶需求,,必須要將芯片、應(yīng)用,,以及服務(wù)等有機地融合在一起,,從而提供一整套的解決方案,才能滿足實際的應(yīng)用需求,。


與此同時,,在 IC 設(shè)計層面,與傳統(tǒng)模式和流程相比,,會更加復(fù)雜,,對此,云知聲聯(lián)合創(chuàng)始人/ IoT 事業(yè)部副總裁李霄寒博士表示:“在最初的設(shè)計階段,,就要考慮應(yīng)用算法,,以及到底需要多大的算力,,如何使軟件能更好地運行等因素。這樣,,就需要 IC 設(shè)計團隊與算法提供者有更緊密的合作,。此時,軟件和硬件的耦合會非常緊密,,這會影響到開發(fā)流程,。傳統(tǒng)的 IC 設(shè)計主要是根據(jù)應(yīng)用來設(shè)計相關(guān)參數(shù),而未來物聯(lián)網(wǎng)應(yīng)用當中的芯片,,特別是 AI 芯片,,在設(shè)計階段,就要根據(jù)實際的應(yīng)用場景,,設(shè)計出相應(yīng)的功能,,然后再去合理調(diào)配軟件和硬件資源,這對設(shè)計者的綜合水平和能力提出了更高的要求,?!?/p>


在物聯(lián)網(wǎng)的邊緣側(cè),對 AI 芯片的性能,、功耗和成本提出了更好的平衡要求,。對此,李霄寒表示,,性能仍然是要優(yōu)先考量的,,也是最重要的,,在此前提下,,再去追求功耗與成本的平衡,而在邊緣側(cè),,成本比功耗更加重要一些,。


那么,對于邊緣側(cè) AI 芯片設(shè)計者來說,,如何能實現(xiàn)以上這些因素的平衡呢,?李霄寒認為:首先,設(shè)計者的算法積累很重要,,因為好的算法能讓硬件發(fā)揮最大的效能,;其次,IC 設(shè)計能力自然也很重要,,特別是要能與業(yè)界實現(xiàn)良好的配合,,以挖掘出更多的 IC 設(shè)計潛力;還有一點,,也是經(jīng)常被忽略的,,那就是對場景的了解,,即經(jīng)歷過整個流程,并有產(chǎn)品的量產(chǎn),,才能對很多實際的考量因素有清晰的認知,,也就是 KnowHow,其會指導(dǎo)你的芯片設(shè)計流程,。這一點非常重要,。


芯片發(fā)展路線


據(jù)悉,云知聲于 2015 年開始量產(chǎn) IVM 模組,,其采用了市場上的通用型芯片,。由于當時市場上還沒有通用型的 AI 芯片,所以多是以多核的 CPU 來實現(xiàn) AI 加速器的功能,。也就是在 2015 年,,該公司決定自行做 AI 芯片,并開始了相關(guān)的規(guī)劃和研發(fā)工作,。


經(jīng)過兩年多的研發(fā),,2018 年5 月,云知聲發(fā)布了其 UniOne 第一代產(chǎn)品——雨燕,,這是一款單模態(tài)的語音專用的 AI 芯片,。據(jù)悉,該公司不僅提供雨燕芯片,,還提供相應(yīng)的開源解決方案,,包含芯片、引擎,、應(yīng)用,,甚至還有云端服務(wù),以及手機 APP 代碼,。據(jù)李霄寒介紹,,這樣做,有利于客戶快速部署其產(chǎn)品,,省去了找第三方開發(fā)各種應(yīng)用的時間和成本,。


據(jù)悉,目前已經(jīng)有近 10 家客戶導(dǎo)入了雨燕芯片,,而且在今年上半年,,很快就能在市場上看到相應(yīng)的量產(chǎn)產(chǎn)品。

微信圖片_20190124201213.jpg


當今的 AI 芯片領(lǐng)域,,存在著多種架構(gòu),,每家都有不同的神經(jīng)網(wǎng)絡(luò)和機器學習產(chǎn)品,那么,云知聲的 AI 芯片是采用怎樣的架構(gòu)和IP呢,?據(jù)悉,,第一代雨燕芯片采用的是該公司自行研發(fā)的 DeepNet 1.0,而其正在研發(fā)的新一代多模態(tài) AI 芯片則采用了升級版本—— DeepNet 2.0,。


向多模態(tài)演進


在物聯(lián)網(wǎng)應(yīng)用初期,,很多 AI 芯片都是以單模態(tài)功能切入市場的,最為普遍的就是語音應(yīng)用,。但是,,未來的應(yīng)用會是多模態(tài)融合的,機器人就是一個典型的多模態(tài)應(yīng)用實例,,還有如車載芯片,,因此,多模態(tài)是市場發(fā)展的必然趨勢,。云知聲在原有單模態(tài)語音 AI 芯片的基礎(chǔ)上,,正在研發(fā)多模態(tài)芯片,主要針對語音和圖像的處理需求,,其相應(yīng)的產(chǎn)品就是基于 DeepNet 2.0的,。

微信圖片_20190124201231.jpg


據(jù)悉,云知聲以 DeepNet 2.0 IP 為核心的 AI 架構(gòu),,算力可以達到 4T,。DeepNet 2.0 是多模態(tài)神經(jīng)網(wǎng)絡(luò)處理器 IP,其主要特點是可以支持多種推理網(wǎng)絡(luò)兼容,,如 LSTM,、CNN、RNN 以及 TDNN 等,;支持可重構(gòu)計算,;還支持 Winograd 處理,將乘法計算量降至原先的一半以下,,大幅提升了計算效率,。李霄寒表示,,DeepNet 2.0 是相對通用的 IP 核,,既可以滿足音頻應(yīng)用需求,也可以實現(xiàn)對圖像的處理,。


另外,,DeepNet 2.0 還支持多 NPU 的組網(wǎng),組成模塊化的網(wǎng)絡(luò),,來支持算力的需求,。


對于架構(gòu),李霄寒表示,,雖然每家的架構(gòu)都有各自的特點和實現(xiàn)方法,,但其上面的軟件會逐步達成統(tǒng)一,,也就是說,支持機器學習的算法會逐漸形成統(tǒng)一的框架,。未來,,有可能形成在不同 AI 芯片硬件上面,可以運行所有神經(jīng)網(wǎng)絡(luò)的模型,,這在不久的將來是完全有可能出現(xiàn)的,。


一直以來,一提起云知聲,,業(yè)內(nèi)人士第一反應(yīng)就是:這是一家做語音方案的公司,,對此,李霄寒表示:“大家給云知聲貼的這個標簽是片面的,,并沒有反應(yīng)出我們公司全部能力,。實際上,云知聲在圖像處理方面也有多年的技術(shù)積累,。我們在這塊很早就開始布局了,,并在 2018 年開始發(fā)力,將相應(yīng)的算法融入到了實際的產(chǎn)品當中,?!?/p>


據(jù)悉,為了在智能語音,、圖像處理等多模態(tài)技術(shù)方面實現(xiàn)快速突破,,云知聲很早便在內(nèi)部搭建了號稱云知聲版“TensorFlow + GKE (Google Kubernetes Engine) ”的 Atlas 機器學習計算平臺,基于該平臺可以實現(xiàn)各種算法的快速迭代,,而且可以靈活調(diào)整算法和算力,,極大地提升了研發(fā)效率。

微信圖片_20190124201304.jpg


在核心競爭力方面,,云知聲采用的都是自家多年積累的 IP,。對此,李霄寒表示:“我們在研發(fā),、推廣芯片產(chǎn)品的同時,,逐步建立、鍛煉出了一支強有力的隊伍,。我們在做語音專用的 DeepNet 1.0 的時候,,市場上還沒有相關(guān)的產(chǎn)品,只有自己研發(fā),。而且,,在推向時候以后,反響不錯,我們才實實在在地意識到這是一款很不錯的產(chǎn)品,,非常適合我們的算法和場景,。因此,在此基礎(chǔ)上,,我們發(fā)展出了 DeepNet 2.0,,與 DeepNet 1.0 相比,DeepNet 2.0 在功能上有了極大的增強,,特別是算力方面,,達到了 4T,另外,,DeepNet 2.0 可以支持多種 NPU,,這也就意味著可以支持多模態(tài)?!?/p>

微信圖片_20190124201320.jpg


就在今年 1 月初,,云知聲正式對外宣布,其正在研發(fā)數(shù)款多模態(tài) AI 芯片,,分別是面向物聯(lián)網(wǎng)的雨燕-Lite,,這是第一代雨燕的升級版本;面向智慧城市的海豚(Dolphin),;面向智慧出行的車規(guī)級芯片雪豹(Leopard),。


發(fā)展三階段


對于云知聲的發(fā)展歷程,李霄寒做出了這樣的總結(jié):公司于 2012 年成立,,至今已有 6 年多的時間,,該公司將其發(fā)展歷史分成了 3 個階段。


李霄寒表示:“公司成立之初的兩年,,是技術(shù)優(yōu)勢構(gòu)建階段,。在該階段,云知聲主要提供軟件算法,、引擎,,服務(wù)等;從 2015 年開始,,我們進入到了產(chǎn)品優(yōu)勢構(gòu)建階段,,也就是大家所熟知的“云端芯”的產(chǎn)品體系。從那時起,,云知聲就不是只提供算法這么簡單了,,而是開始提供應(yīng)用產(chǎn)品了,起初以軟件為主,,而且是整合了各種軟件服務(wù)的產(chǎn)品。而智能醫(yī)療是我們的主戰(zhàn)場,可以提供一整套的軟硬件方案,。在 2015 年之前,,云知聲是不具備硬件設(shè)計能力的,為了補齊短板,,我們在深圳成立了一家分公司,,專門進行硬件設(shè)計和研發(fā);做出產(chǎn)品以后,,我們進入了規(guī)模優(yōu)勢構(gòu)建階段,,基于我們的芯片,實現(xiàn)大規(guī)模的量產(chǎn),,而且在相應(yīng)的應(yīng)用領(lǐng)域,,排名行業(yè)第一。我們一直在觀察市場和時代需求,,以建設(shè)我們相應(yīng)的能力,,進而幫助客戶解決問題。這也是我們于 2015 決定做芯片的主要原因,,市場需求在那里,,我們就去做。而且當時市場上還沒有專用的 AI 芯片,,為了滿足客戶對軟硬件的整體需求,,我們必須自己研發(fā) AI 芯片?!?/p>


加快腳步 只爭朝夕


未來,,不同的應(yīng)用場景和領(lǐng)域會對 AI 芯片有不同的規(guī)范和標準要求,包括功耗,、接口等方面,,都會形成相應(yīng)的標準?!拔磥?,AI 算法很可能都會有相應(yīng)的標準出臺”,李霄寒表示:“硬件和軟件之間的算法接口,,很可能在不久的將來制定標準,,這樣,就可以實現(xiàn)在同一AI 芯片上運行不同廠家的算法,,這種可能性是完全存在的,。而對于我們公司來說,要爭取走得足夠快,,爭取成為標準的實際制定者,。實際上,,我們在家電領(lǐng)域已經(jīng)實現(xiàn)過類似的目標,云知聲是第一家在白色家電領(lǐng)域?qū)崿F(xiàn)專用語音芯片落地的供應(yīng)商,,相應(yīng)的測試標準實際上是由我們制定的,。我們做出測試規(guī)范之后,客戶就用該標準去要求所有的供應(yīng)商,。未來我們依然會按照這樣的模式發(fā)展,,爭取成為更多行業(yè)標準的實際制定者?!?/p>


對于端和邊緣側(cè) AI 芯片市場,,李霄寒認為,邊緣側(cè)的 AI 芯片市場足夠大,,而且仍然處于發(fā)展初期,,遠沒有到大家在一個紅海里拼殺的程度。關(guān)鍵還是要做好供給側(cè)的事情,,市場的需求很大,,也有很多廠商在跟進,但在現(xiàn)階段,,大家的產(chǎn)品做的還都不夠好,,雖然云知聲走在了市場的前列,但依然有很大的提升空間,。


“對于云知聲來說,,要只爭朝夕呀!”李霄寒說,。



人物簡介

微信圖片_20190124201339.jpg

李霄寒博士于 1994 年考入中國科學技術(shù)大學少年班,, 2003 年獲得中科大信號與信息系統(tǒng)博士學位。他曾先后服務(wù)于聯(lián)想,、摩托羅拉中國,、 Nuance 中國、盛大語音創(chuàng)新院等國內(nèi)外知名公司,,先后擔任技術(shù)經(jīng)理,、主任工程師以及研發(fā)總監(jiān)職位。

 

他在 2001 年獲得“微軟學者”稱號,,在 2005 年參與世界第一款嵌入式非特定人中文語音識別軟件研發(fā)并將其廣泛用于摩托羅拉系列產(chǎn)品中,;隨后在 2006 年參與世界第一款嵌入式說話人識別軟件的研發(fā)。李霄寒博士在 2002 年代表微軟,,在 2010 年代表盛大參加“ NIST 國際說話人識別評測”大賽,,共獲得七個單項第一、兩次總分第一名的優(yōu)異成績,。

 

目前他作為云知聲聯(lián)合創(chuàng)始人及 IoT 事業(yè)部副總裁,,分管產(chǎn)品研發(fā),。李霄寒博士負責帶隊研發(fā)的業(yè)界第一款物聯(lián)網(wǎng) AI 芯片在 2018 年上半年成功流片。


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點,。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]