當前,全球電子信息產(chǎn)業(yè)重點領域競爭格局此消彼長,,半導體領域創(chuàng)新風起云涌,,核心芯片技術發(fā)展變革步伐進一步加快,計算呈現(xiàn)出全新發(fā)展趨勢,,多種計算范式和架構(gòu)正逐漸融合,,開始進入“大計算”時代。從上世紀70年代Intel推出第一款處理器到現(xiàn)在,,芯片架構(gòu)歷經(jīng)單核,、同構(gòu)多核等不同時期,當前正邁向異構(gòu)多核時代,。伴隨并行度提高,,同構(gòu)系統(tǒng)處理器核間的并行冗余越來越大,不可并行任務協(xié)調(diào)工作越來越多,,導致系統(tǒng)性能增幅隨冗余增大接近飽和,。異構(gòu)多核芯片的創(chuàng)新涉及軟硬件等深層次創(chuàng)新融合與突破,是普適計算領域新熱點,也是信息產(chǎn)業(yè)發(fā)展重要新拐點,。
全球異構(gòu)計算呈現(xiàn)三強鼎立
異構(gòu)計算系統(tǒng)有兩種實現(xiàn)方式:一是將多個不同類型處理器芯片通過片間集成的方式實現(xiàn)節(jié)點級異構(gòu)計算(稱之為片間異構(gòu));二是基于單(硅)片內(nèi)集成多個不同處理器內(nèi)核的異構(gòu)計算芯片實現(xiàn),,即異構(gòu)計算在芯片級實現(xiàn)(稱之為片內(nèi)異構(gòu))。第二種異構(gòu)計算芯片技術是當前最新技術,。
異構(gòu)計算芯片是將不同架構(gòu)的中央處理器CPU(Central Processing Unit),、圖形處理器GPU (Graphics Processing Unit)、數(shù)字信號處理器DSP(Digital Signal Processor)和FPGA(Field Programmable Gate Array)等特定硬件加速單元依據(jù)相關技術標準和規(guī)范有機內(nèi)在融合在一顆芯片上,,任務由最合適的工作單元來承擔,,不同異構(gòu)內(nèi)核之間實現(xiàn)協(xié)同計算。
隨著同構(gòu)多核達到一定程度,,通過核的堆疊提升計算性能遇到嚴重挑戰(zhàn),,芯片級異構(gòu)計算能夠消除同構(gòu)計算時CPU、GPU,、DSP之間數(shù)據(jù)傳輸時間,,大大提升計算效率,并且以良好的性能協(xié)同支持圖形處理,、信息通信,、人工智能、大數(shù)據(jù)等多領域應用,,基于統(tǒng)一編程規(guī)范和標準,,能大幅減小軟件開發(fā)編程難度、降低產(chǎn)品研制和維護成本,。芯片級異構(gòu)計算已經(jīng)成為解決計算與效能瓶頸的主流技術之一,。
當前,全球異構(gòu)計算領域呈現(xiàn)三強鼎立的態(tài)勢,,分別是以AMD,、高通、ARM,、三星,、北京華夏芯等為主體的全球異構(gòu)計算系統(tǒng)HSA(Heterogeneous System Architecture)聯(lián)盟,以IBM,、Google,、英偉達為主OpenPOWER聯(lián)盟和以Intel主導的異構(gòu)計算體系。其中,,Intel公司異構(gòu)計算體系主要為其自身系列產(chǎn)品和服務使用,,在PC與高性能移動計算領域優(yōu)勢明顯;HSA是完全開放的異構(gòu)計算聯(lián)盟,由于ARM,、高通,、三星等巨頭參與,,在高性能移動計算領域擁有顯著優(yōu)勢。OpenPOWER聯(lián)盟以IBM POWER芯片架構(gòu)技術為基礎,,成立時間最晚,,主要面向高性能計算領域應用。
異構(gòu)計算作為新興技術同樣面臨諸多問題和挑戰(zhàn),,例如從傳統(tǒng)同構(gòu)系統(tǒng),、片間異構(gòu)到片內(nèi)多核異構(gòu),如何對應不同的編程方式,、軟硬件架構(gòu)以及生態(tài)系統(tǒng)等;對于異構(gòu)計算系統(tǒng),無論是片間異構(gòu)還是片內(nèi)異構(gòu),,都需要考慮如何建立完善的軟硬件體系來支撐全新異構(gòu)計算體系,,進而解決生態(tài)問題,使下游產(chǎn)業(yè)鏈用戶主動采用異構(gòu)計算技術,。為應對以上困難及挑戰(zhàn),,在以上三強中,Intel基于其工藝,、技術的先進性,,在PC領域已向異構(gòu)計算技術路徑發(fā)展,目前已有CPU和GPU構(gòu)成的片間異構(gòu)和X86加SSE(Streaming SIMD Extensions)DSP的片內(nèi)異構(gòu)產(chǎn)品,,并擇機向智能終端等移動計算領域拓展,。
Intel公司在2015年6月以167億美元收購全球第二大FPGA公司Altera,成為目前全球唯一具備在片內(nèi)實現(xiàn)CPU+GPU+DSP+FPGA異構(gòu)能力的公司,。OpenPOWER利用Power8等芯片在高性能計算領域的技術優(yōu)勢和IBM產(chǎn)品的應用生態(tài)基礎,,在高性能計算領域占有優(yōu)勢。OpenPOWER中CPU供應商IBM聯(lián)合GPU芯片供應商英偉達,、FPGA供應商賽靈思發(fā)布了CPU+GPU+FPGA的片間異構(gòu)計算系統(tǒng),,主要面向高端服務器市場。HSA主要提供片內(nèi)異構(gòu)多核解決方案——從片內(nèi)異構(gòu)IP(Intellectual Property)核到片內(nèi)異構(gòu)芯片,,有效地解決了應用軟件的重用和互用,,以開放方式合作共建全球異構(gòu)計算產(chǎn)業(yè)生態(tài)。自2010年起,,全球主流芯片廠商均加大新一代異構(gòu)多核處理器芯片(片內(nèi)異構(gòu))的研發(fā)力度,。2015年10月,AMD發(fā)布全球第一款支持HSA標準規(guī)范的片內(nèi)異構(gòu)(CPU+GPU)多核桌面計算機處理器芯片;ARM和Imagination預期在2016年推出支持HSA架構(gòu)的異構(gòu)處理器IP核;我國華夏芯已發(fā)布支持HSA處理器系列工具鏈,,并即將發(fā)布基于CPU,、GPU、DSP的三核異構(gòu)處理器內(nèi)核的IP核及產(chǎn)品;聯(lián)發(fā)科發(fā)布了片內(nèi)異構(gòu)處理器的路線圖;高通,、三星以及英偉達和IBM正在合作研發(fā)片內(nèi)異構(gòu)處理器產(chǎn)品,。
由此可見,異構(gòu)處理器大規(guī)模應用的爆發(fā)期即將到來。預計未來全球范圍內(nèi),,在手機,、平板及其他嵌入式芯片等高性能移動計算領域,異構(gòu)多核芯片市場規(guī)模約20億片,,銷售額約400億美元;在臺式電腦,、筆記本電腦及工業(yè)控制等個人及專業(yè)計算機領域,市場規(guī)模約3億片,,銷售額約550億美元;在大數(shù)據(jù),、人工智能等高性能計算機領域,市場規(guī)模約1000萬片,,銷售額約200億美元,。當前,全球正在研發(fā)片內(nèi)異構(gòu)處理器IP核的公司主要有ARM,、Imagination和北京華夏芯,,已經(jīng)推出或者計劃推出異構(gòu)多核處理器芯片的企業(yè)主要有AMD、Intel,、高通,、英偉達等。
全球HSA,、OpenPOWER等異構(gòu)計算產(chǎn)業(yè)聯(lián)盟其主要目標有兩個:一是主導制定與異構(gòu)計算相關行業(yè)標準,、規(guī)范,推動產(chǎn)品互操作性測試和驗證;二是聯(lián)盟成員合作共建異構(gòu)計算全球應用生態(tài),,共同抗衡Intel公司在異構(gòu)計算領域強大優(yōu)勢,。目前異構(gòu)計算領域在全球影響最大、最先推出產(chǎn)品的HSA聯(lián)盟是2012年由美國AMD公司發(fā)起,,由約60家處理器設計,、工具設計、軟件設計等公司以及大學等科研機構(gòu)共同組成,。該聯(lián)盟成員有AMD,、ARM、高通,、三星,、聯(lián)發(fā)科、德州儀器,、Imagination,、LG、華夏芯,、華為等公司,。聯(lián)盟主要目標是:主導制定異構(gòu)計算相關行業(yè)標準與規(guī)范,,推動產(chǎn)品互操作性測試和驗證;聯(lián)盟成員合作共建異構(gòu)計算全球應用生態(tài)?;贖SA頒布的軟硬件系列接口標準和規(guī)范,,業(yè)界可以設計非常豐富的產(chǎn)品,幾乎覆蓋了從低功耗嵌入式,、智能終端,、平板電腦、PC桌面系統(tǒng)到云端服務器等絕大多數(shù)設備,。華夏芯在HSA聯(lián)盟中首次提出將DSP納入HSA系統(tǒng)構(gòu)架及編譯支撐,,為異構(gòu)系統(tǒng)的擴展做出了重要貢獻。
將推動我國高端芯片產(chǎn)業(yè)
異構(gòu)多核計算芯片及系統(tǒng)可廣泛應用于高性能計算機,、桌面計算機,、智能終端等消費類電子產(chǎn)品以及裝備制造、國防軍工等各領域,。
首先,,異構(gòu)多核計算芯片具有優(yōu)勢,。與傳統(tǒng)同構(gòu)多核計算芯片相比,,異構(gòu)多核計算芯片優(yōu)勢主要體現(xiàn)在如下方面:一是性能與功耗優(yōu)勢。在同等功耗條件下,,異構(gòu)多核計算芯片大幅提升計算效能,。二是產(chǎn)品開發(fā)優(yōu)勢。異構(gòu)多核計算芯片基于嚴謹標準體系,,不同種類處理器單元之間能有機融合和對接,,大幅降低產(chǎn)品開發(fā)門檻,使更多開發(fā)者可加入應用和產(chǎn)品開發(fā)創(chuàng)新,。三是差異化創(chuàng)新優(yōu)勢,。在兼容相關標準前提下,異構(gòu)計算鼓勵芯片設計人員自由選擇處理器單元,,甚至可以設計自主的處理器和指令集,,從而給處理器創(chuàng)新創(chuàng)造巨大空間。四是生態(tài)構(gòu)建優(yōu)勢,。異構(gòu)計算芯片在軟,、硬件之間實現(xiàn)解耦,不同廠商芯片部件之間實現(xiàn)無縫對接和整合,,在生態(tài)共建方面具有著巨大優(yōu)勢,,大幅降低傳統(tǒng)單核與同構(gòu)多核時代生態(tài)瓶頸所帶來的研發(fā)障礙。
其次,,芯片級異構(gòu)計算推動我國高端芯片產(chǎn)業(yè)發(fā)展,。高端芯片是軟硬件創(chuàng)新基石,,盡管我國已獲得了Power、ARM,、MIPS等架構(gòu)授權(quán),,但設計高端芯片所需IP不夠豐富,我國相關技術團隊對其獲授權(quán)架構(gòu)尚不能實現(xiàn)完全解構(gòu),。如不能完全掌握IP核技術,,那么一旦授權(quán)中止,仍存在斷貨及安全風險,,因此目前不能算自主可控,。同時我國雖已在MIPS等指令集核心芯片上取得一定技術與市場進展,但后續(xù)生態(tài)環(huán)境的建設仍面臨巨大挑戰(zhàn),。指令集并沒有優(yōu)劣之分,,任何一個完備指令集都能夠用來編程實現(xiàn)用戶給定的任務,生態(tài)環(huán)境建設是指令集優(yōu)劣唯一評價標準,?!a(chǎn)高端芯片所要進入的市場是傳統(tǒng)處理器大廠已經(jīng)幾乎壟斷的市場,在市場和技術競爭日益激烈的今天,,選擇非主流技術路線就意味著脫離了生態(tài)環(huán)境大家庭,,注定沒有發(fā)展出路。唯有兼容主流,,依靠其生態(tài),、發(fā)展其生態(tài),才能使國產(chǎn)處理器站在一個比較高的起點上,,具備與國際廠商同臺競技的資格,。當前,處理器對生態(tài)系統(tǒng)的依賴從PC開始逐步減弱,。
因此,,從工控市場、手機,、智能電視,、車載終端到高端服務器和存儲設備,國產(chǎn)高端芯片生態(tài)系統(tǒng)的問題都能夠相對容易解決,。隨著HSA的建立與發(fā)展,,HSA框架下的生態(tài)問題變得越來越小。在HSA框架下,,生態(tài)系統(tǒng)支持由包括ARM,、AMD、高通,、Imagination,、聯(lián)發(fā)科,、華夏芯等數(shù)十家芯片公司在內(nèi)的HSA直接提供,無需開發(fā)獨立生態(tài)系統(tǒng),。當前,,CPU+GPU+DSP+FPGA的異構(gòu)融合是芯片領域的主流發(fā)展趨勢之一,這對我國芯片產(chǎn)業(yè)既是挑戰(zhàn)又是機遇,,需進一步加大布局,,盡快推動異構(gòu)計算芯片技術與產(chǎn)業(yè)生態(tài)建立。
發(fā)展異構(gòu)多核計算芯片技術與產(chǎn)業(yè),,第一,,可以擺脫我國在傳統(tǒng)架構(gòu)芯片上與Intel等國外主流芯片廠商競爭的不利局面。在異構(gòu)處理器芯片上,,我國與國外主流處理器廠商處在同一起跑線上,,共同參與新一代異構(gòu)多核處理器的設計、測試與應用,。第二,,可以實現(xiàn)異構(gòu)多核處理器與國產(chǎn)操作系統(tǒng)的無縫對接與共同支撐,基于國產(chǎn)操作系統(tǒng)和國產(chǎn)異構(gòu)多核處理器,,形成牢固支撐中國信息安全的技術和產(chǎn)業(yè)平臺,。第三,可以構(gòu)建由中國主導的異構(gòu)計算應用生態(tài)系統(tǒng),。借助我國在市場,、應用等方面優(yōu)勢地位和影響力,,形成完全自主可控國產(chǎn)高端處理器生態(tài)系統(tǒng),,推進產(chǎn)業(yè)自主創(chuàng)新,兼容并蓄,,使之成為國際主流的技術路徑和生態(tài)體系,。
應加快推進我國異構(gòu)計算產(chǎn)業(yè)實力
我國目前除華夏芯、華為和江南計算技術研究所外,,尚無其他從事完全自主知識產(chǎn)權(quán)異構(gòu)多核芯片設計公司,。當前我國發(fā)展芯片級異構(gòu)計算技術與產(chǎn)業(yè)存在追蹤片內(nèi)異構(gòu)計算的大學和企業(yè)少、投入不足,、整個產(chǎn)業(yè)鏈基礎薄弱,、缺乏高端人才等諸多問題。
近二十年來,,我國開展多個核心處理器研究項目,,取得了包括龍芯、申威,、飛騰,、眾志,、兆芯、中晟宏芯等一系列國產(chǎn)處理器成果,,覆蓋了幾乎國際上所有主流,、非主流的指令架構(gòu)。例如:中科院龍芯以MIPS核心架構(gòu)為基礎開發(fā)了一系列高端處理器,,江南計算技術研究所研制的申威處理器,,我國電子信息產(chǎn)業(yè)集團有限公司生產(chǎn)基于ARM V8指令集的FT-1500A系列處理器,上海兆芯收購了我國臺灣威盛VIA的X86技術和梯隊,,研發(fā)基于Intel X86構(gòu)架超標量CPU處理器,,蘇州中晟宏芯參加OpenPOWER聯(lián)盟,研制了IBM Power 8 CPU,。以上成果主要集中在傳統(tǒng)同構(gòu)計算處理器領域,,與國外同構(gòu)計算處理器最高水平差距約在一代左右。
在芯片級異構(gòu)計算領域,,目前華夏芯,、華為、江南計算技術研究所正在開展自主知識產(chǎn)權(quán)異構(gòu)處理器設計研發(fā),。其中,,華為主要以ARM異構(gòu)計算處理器核為基礎設計異構(gòu)計算芯片和下游產(chǎn)品。江南計算技術研究所研制了“申威-3”高性能異構(gòu)眾核處理器,,是國際上首款萬億次片上融合異構(gòu)眾核處理器,,成功應用于“神州VI”超級計算機。華夏芯公司設計的CPU+GPU+DSP芯片IP核平臺,,從指令集,、微架構(gòu)到工具鏈具有完全自主知識產(chǎn)權(quán),在高性能移動計算領域處于國際領先地位,。
長期以來,,我國在半導體芯片領域主要遵循跟隨戰(zhàn)略,導致在核心技術領域自主創(chuàng)新能力弱,,缺乏話語權(quán),。例如,對異構(gòu)處理器新技術不敏感,,沒有及時跟進HSA的硬件,、過渡語言和并行編程軟件的路線圖與協(xié)議等。
一是對異構(gòu)計算芯片的重要性認識不足,,相關研發(fā)機構(gòu)少,。片內(nèi)異構(gòu)多核計算芯片是構(gòu)建中國處理器產(chǎn)業(yè)全球優(yōu)勢的重要機遇,但國內(nèi)除華夏芯,、華為,、江南計算技術研究所等少數(shù)企事業(yè)單位外,,大部分處理器設計企事業(yè)單位仍在花巨資許可、引進,、研發(fā)傳統(tǒng)同構(gòu)多核計算架構(gòu),。這可能導致異構(gòu)多核計算核心專利、生態(tài)系統(tǒng)被國外巨頭搶先布局和壟斷,,阻礙我國核心芯片技術突破和創(chuàng)新,。
二是異構(gòu)計算系統(tǒng)技術包括芯片、總線及接口,、編程工具,、存儲管理、應用軟件技術等等,。異構(gòu)多核芯片原始創(chuàng)新投入大,,一般企業(yè)承受力有限。在核心技術諸如異構(gòu)多核架構(gòu)指令集,、微架構(gòu),、工具鏈設計等環(huán)節(jié)需投入大量資金和時間以實現(xiàn)自主知識產(chǎn)權(quán)突破,導致企業(yè)自身壓力大,。三是對異構(gòu)多核高端處理器芯片領域的新態(tài)勢,、新商業(yè)模式研究較少,不擅長利用全球高端處理器芯片開放技術,、標準資源,。我國到目前為止尚未有效實現(xiàn)利用自身巨大市場和用戶資源優(yōu)勢影響全球高端處理器芯片相關聯(lián)盟朝著對我國技術和產(chǎn)業(yè)突破有利的方向發(fā)展。
四是發(fā)展異構(gòu)多核高端芯片,,需要一流的技術人才支撐,,而我國大部分高端處理器芯片設計企業(yè)起點低、基礎薄弱,,缺乏核心技術領軍人才和高端設計人才,。我國高端處理器芯片產(chǎn)業(yè)需在全球范圍內(nèi)吸納高端技術與產(chǎn)業(yè)領軍人才,。
借船出海 建立產(chǎn)業(yè)生態(tài)
異構(gòu)計算并不容易,,筆者建議應從以下幾個方面著手。
首先,,以芯片級異構(gòu)計算技術推動高端芯片產(chǎn)業(yè)發(fā)展,。異構(gòu)計算芯片非常好地支持了全球信息技術領域計算與通信、軟件與硬件,、高性能與低功耗等不同領域技術融合發(fā)展趨勢,。目前我國高端處理器芯片設計企業(yè)基礎薄弱,缺乏核心技術,,沒有形成合力,,僅憑自身實力無法與國際主流廠商對等抗衡,。芯片級異構(gòu)計算技術是一個重要的發(fā)展機遇,依托HSA全球聯(lián)盟,,建立有利于我國的優(yōu)勢生態(tài),,可迅速推動我國高端芯片技術與產(chǎn)業(yè)的發(fā)展,后發(fā)趕超,。我們應當抓住這一處理器領域千載難逢的創(chuàng)新和發(fā)展機遇,,積極把片內(nèi)異構(gòu)計算與我國高端處理器芯片技術的發(fā)展、工業(yè)4.0,、互聯(lián)網(wǎng)+以及大眾創(chuàng)業(yè),、萬眾創(chuàng)新緊密結(jié)合。
其次,,以異構(gòu)計算芯片推動端計算融合發(fā)展,。當前,新一代信息技術加速向生產(chǎn)性服務業(yè)滲透,,推動互聯(lián)網(wǎng)與工業(yè)融合創(chuàng)新,,并驅(qū)動傳統(tǒng)信息領域企業(yè)加速向?qū)嶓w經(jīng)濟轉(zhuǎn)型。端計算體系相關技術與產(chǎn)品正向形態(tài)多樣,、高效智能,、全面滲透的方向融合發(fā)展,由此對端計算芯片也提出更高性能需求(需要既能滿足計算密集應用,,也能滿足數(shù)據(jù)密集應用的需求),。
異構(gòu)計算芯片將海量數(shù)據(jù)級并行作業(yè)從過去由CPU承擔分配到GPU和DSP中運行,并讓CPU,、GPU,、DSP處理器之間實現(xiàn)協(xié)同計算,消除過去同構(gòu)計算時CPU,、GPU,、DSP之間數(shù)據(jù)同步和傳輸開銷,從而數(shù)十倍提升計算效能,。片內(nèi)異構(gòu)計算芯片既能滿足計算密集型高性能計算應用的需求,,也能滿足數(shù)據(jù)密集型事物處理應用的需求,可作為發(fā)展端計算技術體系的重要核心技術,。
再次,,依托HAS借船出海,建立高端芯片產(chǎn)業(yè)生態(tài),。我國應積極參與全球異構(gòu)計算產(chǎn)業(yè)聯(lián)盟和標準的各項研究,、共建項目。2010年后,異構(gòu)計算技術與產(chǎn)業(yè)才在全球發(fā)展,,雖然美國在芯片領域有更多的技術,、市場與生態(tài)優(yōu)勢,但參與,、主導并推廣HSA讓我們有機會和美國站在異構(gòu)計算同一個起跑線上,。當前,華夏芯已經(jīng)成為HSA的董事,、發(fā)起人(Promoter),,2015年10月21日,華夏芯公司副總當選為HSA總裁,。通過HSA聯(lián)盟借船出海,,依托全球?qū)笽ntel產(chǎn)業(yè)力量,面向兼容標準構(gòu)建高端芯片自主核心技術產(chǎn)業(yè)生態(tài)是可行途徑,。
最后,,盡快籌建我國新一代異構(gòu)多核計算芯片產(chǎn)業(yè)聯(lián)盟。當前,,我國應積極籌建新一代異構(gòu)多核計算芯片產(chǎn)業(yè)聯(lián)盟,,打造有利于我國自主發(fā)展和主導的國際化生態(tài)應用系統(tǒng)。異構(gòu)計算產(chǎn)業(yè)分工細,,在專用領域技術門檻高,,創(chuàng)新空間大,這些特征非常有利于我國的相關企業(yè)和研究單位的共同參與,,發(fā)揮我國在軟件應用與(集成電路)定制芯片方面的群體優(yōu)勢,,提升異構(gòu)計算產(chǎn)業(yè)在全球的份額和地位;同時,構(gòu)建我國異構(gòu)計算產(chǎn)業(yè)聯(lián)盟和標準平臺也將為相關企業(yè)參與國際一流的技術創(chuàng)新和產(chǎn)業(yè)協(xié)作提供了前所未有的舞臺,。