隨著AI產(chǎn)業(yè)快速突破,,各大公司在AI領(lǐng)域的人才動(dòng)向也在引起極大關(guān)注,,你來我往,、歸去來兮,AI江湖上大有一片血雨腥風(fēng)之勢,。當(dāng)然,,AI領(lǐng)軍人物的變動(dòng),會(huì)對具體公司業(yè)務(wù)造成影響,。但從整個(gè)行業(yè)來看,,人才流動(dòng)的頻繁,反倒有可能促進(jìn)產(chǎn)業(yè)的整體進(jìn)程,。
不信你翻翻歷史,。AI這門功夫自1956年問世以來,至今已經(jīng)歷60年風(fēng)風(fēng)雨雨,,一直是流派眾多,,難學(xué)難練,沒有大成,。
難學(xué),,是因?yàn)楸仨氁莆找环N叫做“算法”的神功;難練,,是因?yàn)樾枰凶銐蛩懔?,能夠處理?shù)據(jù)樣本,訓(xùn)練機(jī)器,。
幾十年來,,一直是有算法沒算力,,甚至于有人認(rèn)為,人工智能就是一個(gè)科幻,,就是小說家跟人類開的一個(gè)玩笑而已,。誰也沒想到,進(jìn)入21世紀(jì)后算力大爆炸,。引發(fā)了整個(gè)AI產(chǎn)業(yè)開天辟地般的變化,。
其中,算法上升為天——深度學(xué)習(xí),,分成DBN,CNN,,BP,,RBM等等諸多分支,其中佼佼者當(dāng)屬CNN(convoluTIonal neural networks),,人稱卷積神經(jīng)網(wǎng)絡(luò),,應(yīng)用廣泛。
算力,,下降為地——AI芯片,。各種芯片如雨后春筍涌現(xiàn),拿過來訓(xùn)練機(jī)器,,得心應(yīng)手啊,。
廟堂之上也為AI駕臨人間雀躍不已。世界各國意識到人工智能的重要性,,紛紛簞食壺漿,,以迎AI。
聯(lián)合國于2016年發(fā)布告示,,召集人類討論機(jī)器人的制造和使用如何促進(jìn)人工智能的進(jìn)步,,以及可能帶來的社會(huì)與倫理問題。
美國政府于2016年連續(xù)頒發(fā)三道金牌:《美國國家人工智能研發(fā)戰(zhàn)略計(jì)劃》,、《為人工智能的未來做好準(zhǔn)備》,、《人工智能、自動(dòng)化與經(jīng)濟(jì)報(bào)告》,,宣稱加入人工智能教派,,并且描繪了此舉能帶來的種種美好的前景。
英國政府見此立即照方抓藥,,刊發(fā)了《機(jī)器人技術(shù)和人工智能》報(bào)告,,詳細(xì)的闡述英國的機(jī)器人技術(shù)與AI的親密關(guān)系。
有算法有算力,,天地已定,。有政策有戰(zhàn)略,,和風(fēng)細(xì)雨。正是產(chǎn)業(yè)萌芽,,草長鶯飛,,欣欣向榮的時(shí)刻。人才的流動(dòng)正是產(chǎn)業(yè)加速的信號,。
書歸正傳,。芯片定義了產(chǎn)業(yè)鏈和生態(tài)圈的基礎(chǔ)計(jì)算架構(gòu),正如CPU是IT產(chǎn)業(yè)的核心一樣,,芯片也是人工智能產(chǎn)業(yè)的核心,。
話說天下AI芯片共分四大流派:
GPU,目前銳氣正盛,,恰似東邪,,憑借并行計(jì)算形成先發(fā)優(yōu)勢。
FPGA,,蟄伏北方,,正在暗地里合縱連橫,大有號令群雄的勢頭,,恰似丐幫,。
ASIC,割據(jù)南方,,占領(lǐng)了大片市場,,參與的公司林立。
類腦芯片,,這個(gè)更“邪性”,,打算直接復(fù)制大腦,也暗藏著問鼎中原的野心,。
根據(jù)互聯(lián)網(wǎng)公開發(fā)布信息,,今年,四大流派已經(jīng)派出幾十路高手,,參與華山論劍,,這些高手均屬于芯片設(shè)計(jì)期高手。
這些高手都有什么特點(diǎn),?誰能逐鹿中原,?下文一一分析。
GPU一派
市場上名氣最大的應(yīng)該是GPU一派,。GPU也稱視覺處理器,,專門用于圖像及相關(guān)處理的芯片。
這四類AI芯片,,最終誰能逐鹿中原
2012年,,Alex Krizhevsky,,多倫多大學(xué)的博士研究生,憑此在ImageNet大賽上奪下了2012屆的冠軍,。Alex提出了一個(gè)奇妙的模型,,僅憑借兩個(gè)GPU就取得了訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)的極佳效果。江湖頓時(shí)為之轟動(dòng),,于是引發(fā)了GPU訓(xùn)練神經(jīng)網(wǎng)絡(luò)的風(fēng)潮,。要知道,AI領(lǐng)域過去曾用CPU處理數(shù)據(jù),,但CPU效力太低,。
當(dāng)年,谷歌曾經(jīng)花費(fèi)巨資購買1.6萬個(gè)處理器,,堆成谷歌大腦,,峰值功耗在10萬瓦以上,占地面積數(shù)十平方米,。試問天下,,有幾人能玩的起1.6萬個(gè)處理器,?
隨著 AlexNet的劃時(shí)代論文橫空出世,,于是GPU 在服務(wù)器端橫掃天下。
有人會(huì)問,,CPU和GPU,,都是處理器,兩者有什么不同,?
與CPU相比,,GPU 出現(xiàn)得遠(yuǎn)比 CPU 晚,但并行計(jì)算能力能卻常令CPU望塵莫及,。并行計(jì)算是相對于串行計(jì)算來說的,。要知道,自計(jì)算機(jī)誕生以來,,電腦編程幾乎一直都是串行計(jì)算,,絕大多數(shù)的程序只存在一個(gè)進(jìn)程或線程,好比一個(gè)人只能先吃飯?jiān)倏戳奶臁?/p>
但更多人喜歡邊吃飯邊聊天怎么辦,?遇到這類問題,,串行計(jì)算就傻眼了。并行計(jì)算一次可執(zhí)行多個(gè)指令的算法,,能夠完美解決吃飯聊天難題,。解決方式可分為時(shí)間上的并行和空間上的并行。時(shí)間上的并行就是指流水線技術(shù),,而空間上的并行則是指用眾多個(gè)處理器并發(fā)的執(zhí)行計(jì)算,。
深度學(xué)習(xí)所依賴的是神經(jīng)系統(tǒng)網(wǎng)絡(luò),,通常網(wǎng)絡(luò)越深,需要的訓(xùn)練時(shí)間越長,。對于一些網(wǎng)絡(luò)結(jié)構(gòu)來說,,如果使用串行的X86 處理器來訓(xùn)練的話,可能需要幾個(gè)月,、甚至幾年,,因此必須要使用并行甚至是異構(gòu)并行的方法,才有可能讓訓(xùn)練時(shí)間變得可以接受,。
在當(dāng)前的人工智能芯片領(lǐng)域,,GPU的應(yīng)用領(lǐng)域不容小覷,據(jù)Jon Peddie Research(簡稱JPR)市場調(diào)研公司統(tǒng)計(jì),,在2008至2015年期間,,除了2008年GPU市場規(guī)模稍有下降,其余年份全球獨(dú)立顯卡的出貨量和銷售額都呈現(xiàn)出明顯的上升趨勢,,并且在2012至2015年有加速上升的表現(xiàn),。
GPU領(lǐng)域只有兩大公司,一是英偉達(dá),,占市場份額約7成,,另一位則是萬年老二AMD,占市場份額約3成,。
從GPU用戶數(shù)量來看,,根據(jù)英偉達(dá)2016年的財(cái)務(wù)報(bào)告,相比2013年的100家,,2014年的1549家,,2015年已有3409家機(jī)構(gòu)或企業(yè)使用英偉達(dá)的GPU產(chǎn)品,從事人工智能的研究,。這些企業(yè)和機(jī)構(gòu)包括各大高等院校的人工智能實(shí)驗(yàn)室,,互聯(lián)網(wǎng)企業(yè),軍事企業(yè)等,。
AMD雖然落后于英偉達(dá),,但2016年的市場份額已呈現(xiàn)出上升趨勢,在發(fā)布了代號Vega織女星的GPU芯片,,市場一片叫好,,未來可能有繼續(xù)上升的趨勢。
不足的是,,GPU 很費(fèi)電(比如高端顯卡動(dòng)輒200W+),,一旦開啟,散熱就成了麻煩事,。
FPGA一幫
GPU美中不足的是就是太貴了,,太貴了,,而且有副作用,降溫是大個(gè)問題,。怎么辦,?
賽靈思等公司改進(jìn)了FPGA許多技術(shù),使之價(jià)格便宜功耗又很低,,操練起來更有趣,。于是,跟隨FPGA的越來越多,,形成了一大流派,。
FPGA是從哪里來的呢?
原來早在1984年賽靈思就發(fā)布世界上首款FPGA,,當(dāng)時(shí)的FPGA晶片尺寸很大,,但成本卻不低。1992年后,,F(xiàn)PGA因采用新工藝節(jié)點(diǎn),,第一次出現(xiàn)了在FPGA上實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)。但直到2000年后,,F(xiàn)PGA丹法結(jié)合了“易容術(shù)”后才略有小成,,易容術(shù)是指FPGA 已不僅是門陣列,還是集成有可編程邏輯的復(fù)雜功能集,。2008以來,,F(xiàn)PGA不光可以越來越多地整合系統(tǒng)模塊,,集成重要的控制功能,,還可以使用更高效的系統(tǒng)編程語言,如OpenCL和C語言,,通過類似軟件的流程來編程,,降低了硬件編程的難度。于是,,自2011年開始,,出現(xiàn)了大規(guī)模基于FPGA的算法研究,。
簡單來說,,F(xiàn)PGA 全稱“現(xiàn)場可編程門陣列”(Field Programmable GateArray),其基本原理是在 FPGA 芯片內(nèi)集成大量的數(shù)字電路基本門電路以及存儲(chǔ)器,,而用戶可以通過更新FPGA 配置文件,,來定義這些門電路以及存儲(chǔ)器之間的連線。
這里提及的“可編程”,,完全就是“可變成”,。這意味著你今天可以把 FPGA 配置成一個(gè)微控制器MCU,,明天就可以更新配置文件把同一個(gè) FPGA 配置成一個(gè)音頻編解碼器。你是不是想起了孫悟空七十二變,,今天是個(gè)老頭明天是個(gè)少女,?此乃易容術(shù)也。
不同于GPU的運(yùn)行原理,,F(xiàn)PGA是以門電路直接運(yùn)算的,,即編程中的語言在執(zhí)行時(shí)會(huì)被翻譯成電路,優(yōu)勢是運(yùn)算速度快,。
在很多領(lǐng)域FPGA的性能表現(xiàn)優(yōu)異,,以至于有人說FPGA可能會(huì)取代CPU和GPU成為將來機(jī)器人研發(fā)領(lǐng)域的主要芯片。當(dāng)然,,這事有點(diǎn)夸張,。目前來看FPGA也多作為CPU的協(xié)處理器而出現(xiàn),沖擊GPU是顯而易見的,,但要說取代CPU,,還得等等。
目前,,國內(nèi)有許多創(chuàng)業(yè)企業(yè),,自動(dòng)加入FPGA陣營,提供基于FPGA的解決方案,。比如源于清華大學(xué)的深鑒科技,,專注于深度學(xué)習(xí)處理器與編譯器技術(shù),深鑒科技研發(fā)了一種名為“深度壓縮”的技術(shù),,它不僅可以將神經(jīng)網(wǎng)絡(luò)壓縮數(shù)十倍而不影響準(zhǔn)確度,,還可以使用“片上存儲(chǔ)”來存儲(chǔ)深度學(xué)習(xí)算法模型,減少內(nèi)存讀取,,大幅度減少功耗,。
FPGA流派的廠商有兩大兩小,兩大廠分別是賽靈思,、Altera(英特爾于2015年以167億美元收購Altera),,兩小是LatTIce和Microsemi。
其中,,賽靈思和Altera占據(jù)了近90%的市場份額,,兩人旗下的專利超過6000項(xiàng)。而剩下約10%的市場份額,,由Microsemi和LatTIce瓜分,,這兩位的專利也有3000余項(xiàng)。由此可以看出,極高的技術(shù)門檻將其它希望進(jìn)入FPGA市場的廠商牢牢擋在門外,。
ASIC:由吸星大法突破
雖然GPU在并行計(jì)算方面有不少優(yōu)勢,,但畢竟不是為機(jī)器學(xué)習(xí)專門設(shè)計(jì)的,F(xiàn)PGA則是需要用戶自主編程,,主要面向?qū)I(yè)領(lǐng)域的企業(yè)用戶,,門檻太高。
大眾消費(fèi)領(lǐng)域怎辦,?如應(yīng)用到無人駕駛汽車上或是智能家居終端,,這款芯片還要同時(shí)滿足高性能和低功耗的要求,甚至不需要將數(shù)據(jù)傳回服務(wù)器端,,不必連入互聯(lián)網(wǎng),,本地即時(shí)計(jì)算即可。
ASIC挺身而出,。
ASIC的全稱是專用集成電路 (ApplicaTIon-Specific Integrated Circuit),。
玩過比特幣的都知道著名的挖礦大戰(zhàn)。ASIC在比特幣挖礦領(lǐng)域,,展現(xiàn)出了得天獨(dú)厚的優(yōu)勢,。2013年1月Avalon項(xiàng)目團(tuán)隊(duì)交付了世界上第一臺商用比特幣ASIC礦機(jī),轟動(dòng)了挖礦世界,。CPU,、GPU礦機(jī)幾乎在一夜之間消失的無影無蹤,引發(fā)了比特幣挖礦行業(yè)第二次重大升級,,比特幣網(wǎng)絡(luò)核心開發(fā)者Jeff Garzik有幸成為了第一個(gè)商業(yè)ASIC礦機(jī)的擁有者,,據(jù)說當(dāng)時(shí)收到Avalon礦機(jī)的用戶在一兩天內(nèi)就回了本。而傳說中隱藏在農(nóng)村的土豪,,能動(dòng)用的ASIC礦機(jī)達(dá)到了數(shù)千臺,。
人工智能深度學(xué)習(xí)和比特幣挖礦有類似之處,都是依賴于底層的芯片進(jìn)行大規(guī)模的并行計(jì)算,。
ASIC分為全定制和半定制,。全定制設(shè)計(jì)需要設(shè)計(jì)者完成所有電路的設(shè)計(jì),,因此需要大量人力物力,,靈活性好但開發(fā)周期長,上市速度慢,。專為機(jī)器學(xué)習(xí)設(shè)計(jì)的ASIC芯片,,從設(shè)計(jì)到制造,對資金和技術(shù)的要求都更高,。一般來說,,基于FPGA的開發(fā)周期大約為六個(gè)月,而相同規(guī)格的ASIC則需要一年左右,,需要經(jīng)過多步驗(yàn)證,,可想而知,,在這樣精細(xì)的打磨下,其性能自然也更為出色,。
ASIC的開發(fā)時(shí)間長,,意味著ASIC芯片很有可能趕不上市場變化的速度,致使廠商陷入竹籃打水一場空的尷尬境地,。
類腦芯片:復(fù)制另一個(gè)人腦
類腦芯片不得不提IBM,,每次產(chǎn)業(yè)變遷,IBN總要給大家?guī)硪恍┬迈r名詞熱鬧一番,。比如電子商務(wù),、智慧星球,認(rèn)知計(jì)算,,現(xiàn)在又帶來了號稱要復(fù)制人腦的類腦芯片,,科技真真太黑了。
IBM類腦芯片的后臺支持者是美國國防部先進(jìn)研究項(xiàng)目局(DARPA),,DARPA是可謂科技圈的泰山北斗,,大名鼎鼎的Internet前身阿帕網(wǎng)即源于這個(gè)機(jī)構(gòu)。
DARPA與IBM合作建立了一個(gè)項(xiàng)目,,名為“神經(jīng)形態(tài)自適應(yīng)伸縮可塑電子系統(tǒng)計(jì)劃(SyNAPSE)”,。該計(jì)劃意圖還原大腦的計(jì)算功能,從而制造出一種能夠模擬人類的感覺,,理解,,行動(dòng)與交流的能力的系統(tǒng),用途非常明確:輔助士兵在戰(zhàn)場動(dòng)態(tài)復(fù)雜環(huán)境中的認(rèn)知能力,,用于無人武器的自動(dòng)作戰(zhàn),。
該項(xiàng)目中最引人注目的是類腦芯片TureNorth。2011年,,IBM發(fā)布第一代TrueNorth芯片,,它可以像大腦一樣具有學(xué)習(xí)和信息處理能力,具有大規(guī)模并行計(jì)算能力,。2014年,,IBM發(fā)布第二代TrueNorth芯片,性能大幅提升,,功耗卻只有70毫瓦,,神經(jīng)元數(shù)量由256個(gè)增加到100萬個(gè),可編程突觸由262144個(gè)增加到2.56億個(gè),。高通也發(fā)布了Zeroth認(rèn)知計(jì)算平臺,,它可以融入到高通Snapdragon處理器芯片中,以協(xié)處理方式提升系統(tǒng)認(rèn)知計(jì)算性能,實(shí)際應(yīng)用于終端設(shè)備上,。
“正北”問世,,激起了國內(nèi)研究機(jī)構(gòu)對人工智能的的熱情。
上海的西井科技去年發(fā)布了全球首塊5000萬神經(jīng)元類腦芯片,。該公司宣稱,,這是目前世界上含有神經(jīng)元數(shù)量最多的類腦芯片,也是首塊可商用化類腦芯片,。
總結(jié):
AI芯片作為產(chǎn)業(yè)上游,,也是技術(shù)要求和附加值最高的環(huán)節(jié),產(chǎn)業(yè)價(jià)值和戰(zhàn)略地位遠(yuǎn)遠(yuǎn)大于應(yīng)用層創(chuàng)新,,因此我們需要高度重視,。
放眼時(shí)代變遷,CPU領(lǐng)域WINTEL聯(lián)盟已經(jīng)一統(tǒng)江山極難突破,,而AI芯片方興未艾,,機(jī)遇正在逐漸顯露,AI領(lǐng)域未來必然也會(huì)產(chǎn)生類似英特爾,、AMD這樣的世界級企業(yè),。
美國以絕對實(shí)力處于領(lǐng)先地位,但一批中國初創(chuàng)企業(yè)也在蓄勢待發(fā),。
但是,,AI芯片領(lǐng)域的創(chuàng)新絕不是件一蹴而就的事情。它涉及到人工智能算法,、編程語言,、計(jì)算機(jī)體系結(jié)構(gòu)、集成電路技術(shù),、半導(dǎo)體工藝的方方面面,。在巨大的國際競爭壓力下,靠單個(gè)企業(yè)研發(fā)投入,,遠(yuǎn)遠(yuǎn)不夠,;單靠有限的風(fēng)險(xiǎn)投資,也不行,??靠萍佳a(bǔ)貼,更是遠(yuǎn)水解不了近渴,。