對(duì)英特爾來(lái)說,“CPU巨頭”的標(biāo)簽已經(jīng)深入人心,。不過,,在最近兩個(gè)月,,CPU在英特爾的關(guān)注度被軟件和獨(dú)立GPU搶了風(fēng)頭,。不知從何時(shí)起,“軟件為先”和“XPU”已經(jīng)成為英特爾新的流行詞,。同樣,,英偉達(dá)對(duì)ARM的收購(gòu),以及AMD對(duì)賽靈思的收購(gòu),,也昭示著芯片巨頭們與英特爾的“不謀而合”,,它們紛紛將未來(lái)的布局瞄準(zhǔn)了同一個(gè)方向:異構(gòu)計(jì)算。
“通用”與“專用”相向而行
從20世紀(jì)60年代的字符終端時(shí)代到如今的智能計(jì)算時(shí)代,,數(shù)據(jù)的量和質(zhì)都發(fā)生了顯著的變化,。以文本、圖表為主的結(jié)構(gòu)化數(shù)據(jù)比例不斷下降,,融媒體數(shù)據(jù),、實(shí)時(shí)處理的傳感級(jí)數(shù)據(jù)等非結(jié)構(gòu)數(shù)據(jù),以及深度學(xué)習(xí)的元數(shù)據(jù)的持續(xù)激增,,將越來(lái)越多種類,、精度的數(shù)據(jù)以更快的速度進(jìn)行傳輸和處理,并成為智能計(jì)算的剛需,。
作為通用處理器的代表型廠商,,英特爾已經(jīng)將異構(gòu)計(jì)算作為應(yīng)對(duì)AI時(shí)代算力挑戰(zhàn)的關(guān)鍵戰(zhàn)略。如果將數(shù)據(jù)看作食材,,CPU就相當(dāng)于“瑞士軍刀”,,適用于一切食材,卻不一定能將所有食材處理得又快又好,。GPU,、FPGA、DSP等專用處理器的加入,,讓計(jì)算架構(gòu)能更有效地應(yīng)對(duì)場(chǎng)景化數(shù)據(jù),。
“異構(gòu)計(jì)算的產(chǎn)業(yè)的基礎(chǔ)是數(shù)據(jù)的爆炸式增長(zhǎng),這其實(shí)是我們發(fā)展異構(gòu)計(jì)算的主要驅(qū)動(dòng)力,?!庇⑻貭柤軜?gòu)、圖形和軟件集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理謝曉清在接受《中國(guó)電子報(bào)》采訪時(shí)指出,“CPU提供的是通用型計(jì)算的能力,,解決的問題很廣義,。但是GPU、FPGA,,或者AI加速芯片解決的是特定領(lǐng)域的問題。現(xiàn)在很多數(shù)據(jù)的產(chǎn)生都有一定的特點(diǎn),,以至于在CPU上的運(yùn)算效果不一定是最理想的,,在GPU或者其他并行計(jì)算能力高的芯片上會(huì)跑得更好,這是異構(gòu)計(jì)算的主要驅(qū)動(dòng)力,?!?/p>
作為專用處理器廠商,賽靈思從器件向異構(gòu)平臺(tái)的轉(zhuǎn)變也已開始,。賽靈思大中華區(qū)核心市場(chǎng)業(yè)務(wù)發(fā)展總監(jiān)酆毅向《中國(guó)電子報(bào)》記者指出,,智能駕駛正在從ADAS逐漸向全面自動(dòng)駕駛持續(xù)演進(jìn),傳感器數(shù)量的增多勢(shì)必會(huì)帶來(lái)爆炸式的數(shù)據(jù)增長(zhǎng),,這就需要汽車具備強(qiáng)大的異構(gòu)計(jì)算平臺(tái),。在工業(yè)視覺領(lǐng)域,機(jī)器人技術(shù),、工業(yè)PC,、I/O的模塊、智能傳感器,、人機(jī)界面等都在產(chǎn)生不同類型的數(shù)據(jù),。在專業(yè)音視頻和廣播領(lǐng)域,從內(nèi)容采集到內(nèi)容消費(fèi)的全部過程也需要遠(yuǎn)程管理不同的服務(wù)器和計(jì)算平臺(tái),。
“單獨(dú)的計(jì)算架構(gòu),,無(wú)法滿足越來(lái)越多樣的開發(fā)需求,因此,,異構(gòu)計(jì)算是未來(lái)的發(fā)展之路,。”酆毅指出,,“伴隨工藝的進(jìn)步,,F(xiàn)PGA也打破了傳統(tǒng)的應(yīng)用邊界,進(jìn)入到AI,、數(shù)據(jù)中心,、視頻處理、自動(dòng)駕駛,、5G等新興領(lǐng)域中,。而FPGA也通過集成標(biāo)量處理引擎、自適應(yīng)硬件引擎和智能引擎,,完成了從器件到異構(gòu)平臺(tái)的轉(zhuǎn)變,?!?/p>
引發(fā)芯片巨頭割據(jù)戰(zhàn)
在很長(zhǎng)一段時(shí)間里,處理器市場(chǎng)維持著英特爾,、英偉達(dá)各自引領(lǐng)CPU和GPU的狀態(tài),,且AMD在兩個(gè)市場(chǎng)均為第二。如今,,這種局面正在被打破,。通過一連串基于收購(gòu)和自研的“補(bǔ)課”行為,三大處理器頭部廠商都在向CPU+GPU+FPGA/NPU的方向靠攏,,為異構(gòu)計(jì)算儲(chǔ)備“彈藥”,。
上個(gè)月,英特爾時(shí)隔22年重返獨(dú)顯市場(chǎng),,正式發(fā)布獨(dú)立顯卡iRIS Xe Max,。眾所周知,英特爾從2015年起,,陸續(xù)收購(gòu)了當(dāng)時(shí)第二大FPGA廠商Altera,、自動(dòng)駕駛視覺處理公司Mobileye和云端AI推理芯片Habana Labs等一系列芯片廠商,充實(shí)了FPGA和AI專用芯片的產(chǎn)品線,。獨(dú)立顯卡的發(fā)布,,不僅讓英特爾彌補(bǔ)了PC產(chǎn)品線的關(guān)鍵零部件,也補(bǔ)齊了XPU異構(gòu)計(jì)算架構(gòu)的關(guān)鍵拼圖,。
AMD對(duì)賽靈思的收購(gòu),,也釋放出強(qiáng)化異構(gòu)計(jì)算布局的信號(hào)。在具備“CPU+GPU”計(jì)算架構(gòu)的基礎(chǔ)上,,F(xiàn)PGA的可編程特質(zhì),,能進(jìn)一步提升計(jì)算平臺(tái)的靈活性,從而適應(yīng)AI時(shí)代根據(jù)不同工作負(fù)載進(jìn)行加速的需求,。同時(shí),,賽靈思在異構(gòu)計(jì)算上也有所積累,已推出Versal ACAP異構(gòu)計(jì)算平臺(tái),,以縮短車載多傳感器同步和融合所帶來(lái)的系統(tǒng)整體響應(yīng)時(shí)間,。據(jù)酆毅介紹,賽靈思圍繞異構(gòu)計(jì)算的布局已在兩年前開始,,包括智能駕駛,、專業(yè)音視頻、工業(yè)等相關(guān)領(lǐng)域,,都緊密圍繞著異構(gòu)計(jì)算的數(shù)據(jù)需求進(jìn)行開發(fā),。
對(duì)于英偉達(dá),收購(gòu)ARM不僅彌補(bǔ)了缺乏CPU的短板,也將英偉達(dá)的AI計(jì)算平臺(tái)拓展到移動(dòng)生態(tài),。值得注意的是,,ARM也在異構(gòu)計(jì)算有所著墨?;陂_源的開發(fā)框架ARM NN,,開發(fā)者可以調(diào)動(dòng)ARM CPU、GPU及NPU,,實(shí)現(xiàn)異構(gòu)AI開發(fā),。據(jù)悉,在去年舉辦的ISC 2019國(guó)際超算大會(huì)上,,英偉達(dá)宣布,,計(jì)劃利用其GPU與使用ARM架構(gòu)的CPU協(xié)作打造超級(jí)計(jì)算機(jī),。在宣布對(duì)ARM的收購(gòu)計(jì)劃后,,英偉達(dá)再次強(qiáng)調(diào)將建造搭載ARM CPU的AI超級(jí)計(jì)算機(jī)?!俺恪庇型蔀橛ミ_(dá)與ARM合流異構(gòu)計(jì)算的第一個(gè)“練兵場(chǎng)”,。
如何應(yīng)對(duì)“跨生態(tài)”挑戰(zhàn)
“軟件優(yōu)先?!闭劶爱悩?gòu)計(jì)算的布局思路,,謝曉清向記者表示,“在設(shè)計(jì)硬件,、芯片的時(shí)候,,甚至在設(shè)計(jì)指令集的時(shí)候,我們會(huì)以軟件優(yōu)先的原則去做,?!?/p>
異構(gòu)計(jì)算帶來(lái)的硬件復(fù)雜性,對(duì)編程人員提出了嚴(yán)苛的挑戰(zhàn),。如果異構(gòu)計(jì)算包含CPU,、GPU、FPGA,、ASIC四種硬件,,就意味著編程人員必須掌握四種硬件的優(yōu)化代碼,才能編寫或遷移程序,。屏蔽硬件復(fù)雜性的軟件平臺(tái)已經(jīng)成為異構(gòu)計(jì)算的必備工具,。
oneAPI是英特爾為異構(gòu)計(jì)算架構(gòu)打造的開源軟件平臺(tái),使開發(fā)者可以選擇熟悉的語(yǔ)言,、單一的代碼庫(kù)以及統(tǒng)一的編程模型,,來(lái)開發(fā)跨架構(gòu)的應(yīng)用程序。
“我們希望生成一個(gè)軟件生態(tài),使應(yīng)用程序開發(fā)商基于統(tǒng)一,、開放的規(guī)范進(jìn)行開發(fā)工作,,不會(huì)因?yàn)檐浖腃PU遷移到GPU或者是FPGA而進(jìn)行任何的修改或重復(fù)投資?!?謝曉清說,。
英特爾不是唯一意識(shí)到異構(gòu)計(jì)算需要“軟硬兼施”的廠商。在軟件平臺(tái)方面,,英偉達(dá)推出了CUDA,,AMD推出了ROCm,華為也陸續(xù)推出了Atlas,、CANN等面向異構(gòu)場(chǎng)景的平臺(tái)及架構(gòu),。
異構(gòu)計(jì)算的復(fù)雜性和融合性,意味著各大廠商一開始就從生態(tài)競(jìng)爭(zhēng)的維度進(jìn)行布局,。那么,,多種生態(tài)競(jìng)爭(zhēng)并存的關(guān)系,是否會(huì)讓開發(fā)者在免除跨架構(gòu)開發(fā)的麻煩后,,又陷入“跨生態(tài)”開發(fā)的困難?
對(duì)此,,謝曉清認(rèn)為,如果各家將中間平臺(tái)統(tǒng)一起來(lái),,形成相對(duì)統(tǒng)一的框架,,可以在保持差異性的同時(shí)降低上層應(yīng)用的開發(fā)難度。
“如果各個(gè)芯片廠商都從最底層做軟件,,重復(fù)投資會(huì)非常大,。在理想情況下,應(yīng)當(dāng)有一個(gè)框架,,在這個(gè)框架下每家做好自己的硬件優(yōu)化,。對(duì)上層應(yīng)用開發(fā)者來(lái)說,硬件復(fù)雜性被屏蔽掉,,且編譯器,、庫(kù)函數(shù)、接口等均已定義好,,在這個(gè)統(tǒng)一的框架下再開發(fā)編程即可,。在運(yùn)行應(yīng)用的時(shí)候,負(fù)載會(huì)自動(dòng)流向最合適的硬件,,這可能是未來(lái)異構(gòu)計(jì)算的理想情況,。”謝曉清說,。