《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 業(yè)界動(dòng)態(tài) > 網(wǎng)絡(luò)處理器芯片的國(guó)產(chǎn)化之路

網(wǎng)絡(luò)處理器芯片的國(guó)產(chǎn)化之路

2015-01-20

芯片主要用于構(gòu)建網(wǎng)絡(luò)通信基礎(chǔ)設(shè)施平臺(tái),,對(duì)于位于網(wǎng)絡(luò)通信終端節(jié)點(diǎn)的用戶來(lái)說(shuō),,通常是透明而不可見(jiàn)的,。因此,,與通用以及等大眾電子消費(fèi)密切相關(guān)的通用處理器芯片相比,,(Network Processor)芯片一直以來(lái)很少能夠獲得廣泛的關(guān)注,。

  實(shí)際上,,廣 泛應(yīng)用于包括路由器,、交換機(jī)等各類(lèi)網(wǎng)絡(luò)核心設(shè)備中,,它特定應(yīng)用于網(wǎng)絡(luò)通信領(lǐng)域的各種任務(wù),,例如報(bào)文處理、協(xié)議分析,、路由查找,、防火墻以及QoS等。網(wǎng)絡(luò)處 理器芯片對(duì)于網(wǎng)絡(luò)通信基礎(chǔ)設(shè)施的重要性,,阿爾卡特朗訊公司的 Basil Alwan有一句話形容得很貼切,,“網(wǎng)絡(luò)處理器是網(wǎng)絡(luò)設(shè)備最根本的基因,它定義了路由器平臺(tái)的能力,、可擴(kuò)展性以及面向未來(lái)演化的可能性[1]”,。

  國(guó)內(nèi)外研制情況

  經(jīng)過(guò)多年的發(fā)展,,網(wǎng)絡(luò)處理器正逐漸替代網(wǎng)絡(luò)通信設(shè)備中固定功能的ASIC芯片,已成為構(gòu)建網(wǎng)絡(luò)通信系統(tǒng)的戰(zhàn)略性核心器件,。商用網(wǎng)絡(luò)處理器市場(chǎng)在不斷增長(zhǎng),,而市場(chǎng)上網(wǎng)絡(luò)處理器芯片產(chǎn)品則基本上來(lái)自國(guó)外廠商。

  傳統(tǒng)網(wǎng)絡(luò)處理器按核心處理單元的不同可以分為兩類(lèi),,即基于微核的網(wǎng)絡(luò)處理器(NPU)以及基于通用核的網(wǎng)絡(luò)處理器(GNP),,主要區(qū)別如表1所示。


  目前,,典型商用網(wǎng)絡(luò)處理器芯片包括阿爾卡特朗訊的FP系列[1]、Marvell 公司的Xelerated系列[2],、EZchip的NP系列[3]等,。上述網(wǎng)絡(luò)處理器通常采用多核多線程、超流水等高級(jí)體系結(jié)構(gòu),,利用功能部件定制優(yōu)化,、深亞微米集成電路設(shè)計(jì)等技術(shù)提高報(bào)文處理性能,其中多款網(wǎng)絡(luò)處理器可以達(dá)到400Gbps報(bào)文處理要求,。

  阿爾卡特朗訊公司的FP3網(wǎng)絡(luò)處理器集成共288個(gè)RISC Core,,主頻可達(dá)1GHz,其中每32個(gè)Core為一個(gè)Cluster,,共9個(gè)Cluster,。它采用多Pipeline處理模型,F(xiàn)P3的報(bào)文轉(zhuǎn)發(fā)處 理能力高達(dá)400Gbps,。與FP3類(lèi)似,,Marvell公司的HX4100網(wǎng)絡(luò)處理器(原Xelerated公司)也采用類(lèi)似的多Pipeline處理 模型,通過(guò)集成數(shù)百個(gè)支持VLIW指令集的PISC(Packet Instruction set computer)專(zhuān)用處理器核,,也可實(shí)現(xiàn)400Gbps線速報(bào)文處理,。值得一提的是,HX4100流水線間得PISC采用同步數(shù)據(jù)流體系結(jié)構(gòu),,從而避免 了控制流模型中的指令相關(guān)性對(duì)性能的影響,,可確保系統(tǒng)獲得確定性的處理性能。EZchip的NP-5采用Functional Pipeline處理模型,,處理流程映射到4級(jí)面向任務(wù)優(yōu)化的處理引擎,,采用專(zhuān)用指令集,基于功能編程語(yǔ)言(FPL)開(kāi)發(fā),,分組處理能力達(dá)到 240Gbps,。上述芯片產(chǎn)品都屬于基于微核的網(wǎng)絡(luò)處理器,大多采用流水線方式組織,,以提供極高的報(bào)文轉(zhuǎn)發(fā)處理性能,,在芯片功耗方面具有優(yōu)勢(shì),,主要缺點(diǎn)是 通常僅支持微碼編程,軟件開(kāi)發(fā)復(fù)雜困難,。

  Broadcom公司的XLP II 900網(wǎng)絡(luò)處理器[4]集成了多達(dá)80個(gè)通用CPU核(nxCPUs),,具有三級(jí) Cache存儲(chǔ)子系統(tǒng)和4個(gè)DDR3內(nèi)存控制器,,采用并行處理架構(gòu),,可提供160Gbps報(bào)文轉(zhuǎn)發(fā)處理性能。通過(guò)集成安全加速引擎,,其可支持高性能的加 密,、認(rèn)證以及深度報(bào)文檢測(cè)等功能。Cavium公司的OCTEON III網(wǎng)絡(luò)處理器[5]也采用并行架構(gòu),,通過(guò)集成48個(gè)64位 MIPSCPU核和大量的加速引擎,,可提供100Gbps報(bào)文轉(zhuǎn)發(fā)處理能力,并支持廣泛的網(wǎng)絡(luò)業(yè)務(wù)處理硬件加速,。上述芯片產(chǎn)品都屬于基于通用CPU核的網(wǎng) 絡(luò)處理器(GNP),,面向支持多樣化網(wǎng)絡(luò)高層協(xié)議和業(yè)務(wù)處理設(shè)計(jì),具有較強(qiáng)的可編程性,,通??梢灾С諧/C++高級(jí)語(yǔ)言編程,并運(yùn)行通用Linux操作系 統(tǒng),,從而為開(kāi)發(fā)人員帶來(lái)便捷,。然而,集成度與功耗問(wèn)題嚴(yán)重制約了GNP的性能提升,。

  從國(guó)內(nèi)來(lái)看,,華為、中興等網(wǎng)絡(luò)設(shè)備廠商以及國(guó)防科大等科研院所早已基于國(guó)外成熟網(wǎng)絡(luò)處理器芯片設(shè)計(jì)了多款高性能路由器產(chǎn)品,,并已經(jīng)在國(guó)內(nèi)外市場(chǎng) 上得到廣泛應(yīng)用,。國(guó)防科大、西安電子科大以及清華大學(xué)等單位在國(guó)內(nèi)也較早開(kāi)展了網(wǎng)絡(luò)處理器研制,,取得了一定進(jìn)展和技術(shù)積累,,但與國(guó)外仍有一定差距,目前還 沒(méi)有成熟的國(guó)產(chǎn)商用網(wǎng)絡(luò)處理器芯片產(chǎn)品,。

  隨著國(guó)家戰(zhàn)略層面對(duì)網(wǎng)絡(luò)通信基礎(chǔ)設(shè)施安全及自主創(chuàng)新能力的重視,,作為構(gòu)建網(wǎng)絡(luò)通信設(shè)備的核心器件,網(wǎng)絡(luò)處理器芯片的國(guó)產(chǎn)化將是一種必然,。為了選擇一條切實(shí)可行的網(wǎng)絡(luò)處理器研制的技術(shù)途徑,,必須充分把握網(wǎng)絡(luò)處理器研制所面臨的挑戰(zhàn)和技術(shù)發(fā)展趨勢(shì)。

研制挑戰(zhàn)與技術(shù)趨勢(shì)

  與通用不同,,芯片研制一方面涉及網(wǎng)絡(luò)通信,、微電子,、操作系統(tǒng)以及處理器體系結(jié)構(gòu)等多個(gè)領(lǐng)域的技術(shù),設(shè)計(jì)難度大;另一方面其處理性能必須能夠匹配飛速增長(zhǎng)的網(wǎng)絡(luò)接口帶寬需求,,硬性要求高,。因此,芯片復(fù)雜度高,、實(shí)現(xiàn)困難,,其研制周期長(zhǎng),投入資金高昂,,研發(fā)難度非常大,,這也是國(guó)產(chǎn)商用高性能遲遲未取得突破的重要原因。以思科公司為例,,其SPP網(wǎng)絡(luò)處理器于1999年開(kāi)始設(shè)計(jì),,2003年才在cisco的第一臺(tái)集群路由器CRS-1中使用;而其在2008年設(shè)計(jì)完成的QFP網(wǎng)絡(luò)處理器前后共花費(fèi)1億美金才研制成功,商用高性能網(wǎng)絡(luò)處理器的研制難度可見(jiàn)一斑,。

  從技術(shù)發(fā)展趨勢(shì)看,,隨著軟件定義網(wǎng)絡(luò)(Software Defined Network,SDN),、網(wǎng)絡(luò)功能虛擬化(Network Function Virtualization)等技術(shù)的出現(xiàn)和發(fā)展,,對(duì)網(wǎng)絡(luò)通信設(shè)備的可編程性提出更高要求。不斷演化的網(wǎng)絡(luò)通信業(yè)務(wù)和協(xié)議也要求構(gòu)建網(wǎng)絡(luò)通信設(shè)備的核心 器件必須能夠易于編程開(kāi)發(fā),,以期加快系統(tǒng)研制進(jìn)度,、降低開(kāi)發(fā)成本并實(shí)現(xiàn)投資保護(hù)?;谕ㄓ?span id="aes6ws0" class="contentlabel">CPU核的網(wǎng)絡(luò)處理器GNP雖然提供高度的可編程性支持,,然而在功耗及芯片集成度方面的天然劣勢(shì)使其難以滿足飛速增長(zhǎng)的網(wǎng)絡(luò)通信帶寬的需求。

  針對(duì)上述問(wèn)題,,Intel公司提出未來(lái)的通信處理平臺(tái)應(yīng)該以通用多核為核心,,采用芯片組方式,從而在性能與可編程性間獲得完美折衷,。Intel的Crystal Forest通信處理平臺(tái)[6]采 用雙Xeon處理器作為分組處理的主要功能單元,,通過(guò)集成片外QuickAssist加速器,將DPI,、加解密以及解壓縮等常用的分組處理功能卸載到 QuickAssist加速器中,。從軟件層面看,QuickAssist通過(guò)提供加速器抽象層,,隔離各種物理實(shí)體,,從而允許上層軟件都通過(guò)統(tǒng)一接口訪問(wèn)多 樣化的硬件加速器。雖然,Crystal Forest通信平臺(tái)目前僅可以支持約100Gbps的流量的線速處理,,與業(yè)界高性能網(wǎng)絡(luò)處理器有一定差距,,但是我們認(rèn)為Intel提出的基于通用多核 CPU的多芯片解決方案值得思考和借鑒。多芯片解決方案可以有效緩解對(duì)網(wǎng)絡(luò)處理器芯片設(shè)計(jì)的性能壓力,,并在系統(tǒng)升級(jí),、部署方面提供更大的靈活性。在思科以 及阿爾卡特朗訊最近推出的高性能核心路由器中(例如思科CRS-3),,高性能轉(zhuǎn)發(fā)線卡都集成多個(gè)處理芯片協(xié)同完成分組轉(zhuǎn)發(fā)處理業(yè)務(wù),。

  國(guó)產(chǎn)化技術(shù)途徑

  在把握了網(wǎng)絡(luò)處理器芯片研制挑戰(zhàn)以及發(fā)展趨勢(shì)的基礎(chǔ)上,我們認(rèn)為基于國(guó)產(chǎn)通用多核CPU+可編程網(wǎng)絡(luò)處理引擎(NPE)的架構(gòu)是網(wǎng)絡(luò)處理器芯片 國(guó)產(chǎn)化一條現(xiàn)實(shí)可行的技術(shù)途徑,。實(shí)際上,,網(wǎng)絡(luò)處理器研制與高性能CPU及通用操作系統(tǒng)研制有很多共性技術(shù),,例如高性能RISC核設(shè)計(jì),、片上網(wǎng)絡(luò)、低延時(shí)高 帶寬的存儲(chǔ)器接口,、操作系統(tǒng)和編譯系統(tǒng)等,。以飛騰、龍芯為代表的國(guó)產(chǎn)通用多核CPU以及以麒麟為代表的國(guó)產(chǎn)操作系統(tǒng)在國(guó)家核高基等項(xiàng)目支持下已取得巨大突 破,,其相關(guān)成果已經(jīng)在國(guó)家信息系統(tǒng)建設(shè)中發(fā)揮重要作用,。因此,有效利用國(guó)產(chǎn)高性能CPU和操作系統(tǒng)的研究成果,,并對(duì)其網(wǎng)絡(luò)處理能力進(jìn)行充分挖潛,,是縮短國(guó) 產(chǎn)網(wǎng)絡(luò)處理器芯片研制周期,降低研制成本和風(fēng)險(xiǎn)的有效途徑,。

  然而,,通用多核CPU主要面向通用計(jì)算領(lǐng)域設(shè)計(jì),適用于計(jì)算密集型的應(yīng)用,。而網(wǎng)絡(luò)處理器則主要面向網(wǎng)絡(luò)處理領(lǐng)域設(shè)計(jì),,適用于訪存密集型應(yīng)用。如 何提高通用CPU的訪存計(jì)算比(MCR)是決定能否利用通用CPU進(jìn)行網(wǎng)絡(luò)處理的關(guān)鍵,。針對(duì)這一問(wèn)題,,國(guó)防科技大學(xué)課題組對(duì)網(wǎng)絡(luò)處理器實(shí)現(xiàn)模型和途徑進(jìn)行 了深入研究和探索,提出應(yīng)擺脫傳統(tǒng)以多核軟件為核心的實(shí)現(xiàn)模型,,由可編程硬件(即NPE)定義網(wǎng)絡(luò)報(bào)文的處理路徑,,并對(duì)性能敏感的功能進(jìn)行硬化卸載,從而 有效降低通用多核CPU軟件的處理壓力,,實(shí)現(xiàn)系統(tǒng)性能提升,。這種“硬件定義”的處理模型允許在不改變現(xiàn)有通用多核CPU內(nèi)部架構(gòu)、不對(duì)其內(nèi)部實(shí)現(xiàn)進(jìn)行特定 優(yōu)化的前提下,縮短網(wǎng)絡(luò)處理器研制周期,,降低研制成本,,從而有效加速網(wǎng)絡(luò)處理器芯片的國(guó)產(chǎn)化進(jìn)程。

  總結(jié)

  網(wǎng)絡(luò)處理器芯片作為構(gòu)建網(wǎng)絡(luò)通信基礎(chǔ)設(shè)施的核心器件,,其國(guó)產(chǎn)化必須綜合考慮芯片的設(shè)計(jì)復(fù)雜度和研制難度,,準(zhǔn)確把握技術(shù)發(fā)展趨勢(shì)。我們認(rèn)為,,國(guó)產(chǎn)通用多核CPU與可編程網(wǎng)絡(luò)處理引擎(NPE)相結(jié)合的體系結(jié)構(gòu)是解決網(wǎng)絡(luò)處理器“中國(guó)芯”的問(wèn)題的一條希望之路,。

  參考文獻(xiàn):
  [1] 阿爾卡特朗訊FP3網(wǎng)絡(luò)處理器[R/OL],http://www.alcatel-lucent.com/products/fp3.
  [2]Marvell Xelerated網(wǎng)絡(luò)處理器[R/OL],,http://www.marvell.com/network-processors/xelerated-hx/.
  [3]EZchip NP-5網(wǎng)絡(luò)處理器[R/OL],,http://www.ezchip.com/p_np5.htm.
  [4]Broadcom XLP900網(wǎng)絡(luò)處理器[R/OL],  http://www.broadcom.com/products/Processors/Enterprise/XLP900-Series
  [5]CaviumOcteon III網(wǎng)絡(luò)處理器[R/OL],,http://www.cavium.com/OCTEON-III_CN7XXX.html.
  [6]TianTian, Alexander Belousov. Intel下一代通信平臺(tái)數(shù)據(jù)平面解決方案,,2012.12.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問(wèn)題,,請(qǐng)及時(shí)通過(guò)電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。