《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 顯示光電 > 設(shè)計(jì)應(yīng)用 > 核內(nèi)顯卡逆襲 Sandy Bridge平臺(tái)全解析
核內(nèi)顯卡逆襲 Sandy Bridge平臺(tái)全解析
王承祥
摘要: 英特爾IDF2011在風(fēng)和日麗的13日終于落下帷幕,。本屆IDF以“智無(wú)界,,芯跨越”(Compute Continuum and Beyond)為主題,將進(jìn)一步展示英特爾如何通過(guò)從硬件,、平臺(tái)到軟件和服務(wù)全面的計(jì)算解決方案,,推進(jìn)個(gè)性化互聯(lián)網(wǎng)發(fā)展,;同時(shí)面向中國(guó)市場(chǎng)如何支持本地合作伙伴創(chuàng)新,助力新一代信息技術(shù)等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展,。而回顧本次IDF,,依然有很多情景讓我們覺得身臨其境,再先進(jìn)的技術(shù)最后也只有一個(gè)用處,,那就是應(yīng)用在改變大家的生活當(dāng)中,。
Abstract:
Key words :

    英特爾IDF2011在風(fēng)和日麗的13日終于落下帷幕。本屆IDF以“智無(wú)界,,芯跨越”(Compute Continuum and Beyond)為主題,,將進(jìn)一步展示英特爾如何通過(guò)從硬件、平臺(tái)到軟件和服務(wù)全面的計(jì)算解決方案,,推進(jìn)個(gè)性化互聯(lián)網(wǎng)發(fā)展,;同時(shí)面向中國(guó)市場(chǎng)如何支持本地合作伙伴創(chuàng)新,助力新一代信息技術(shù)等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展,。而回顧本次IDF,,依然有很多情景讓我們覺得身臨其境,再先進(jìn)的技術(shù)最后也只有一個(gè)用處,,那就是應(yīng)用在改變大家的生活當(dāng)中,。

IDF2011落下帷幕

     在此次的IDF上,借助內(nèi)容豐富的主題演講,、技術(shù)課程和技術(shù)展示將Intel在技術(shù)與研發(fā)方面的最新成果加以詮釋,推動(dòng)用戶走在科技發(fā)展的最前沿,。其中,,作為英特爾在2011年的創(chuàng)新---第二代英特爾® 酷睿™處理器,代號(hào) Sandy Bridge的相關(guān)主題講座將成為此次IDF的重頭之一。

IDF2011落下帷幕

    盡管SandyBridge平臺(tái)早在年初就已發(fā)布,,但對(duì)于多數(shù)用戶而言英特爾僅提升了概念性認(rèn)識(shí),。至于在實(shí)際應(yīng)用細(xì)節(jié)方面的實(shí)現(xiàn)并沒(méi)有明確的透露。而在此次IDF 2011論款上包括Intel首席高級(jí)工程師Opher Kahn,,首席多媒體工程師Hong Jiang博士等多位資深專家在現(xiàn)為廣大的與會(huì)者就Sandy Bridge平臺(tái)的微架構(gòu),、圖形處理單元,、多媒體優(yōu)化以及高清圖形處理方面的設(shè)計(jì)思路和性能體驗(yàn)進(jìn)行了全面的解讀。

     英特爾繼續(xù)履行其堅(jiān)定的承諾,,籍由下一代微架構(gòu)代號(hào)Sandy Bridge 來(lái)推動(dòng)處理器能力和指令集的發(fā)展,。這一革命性的微架構(gòu)構(gòu)建于32 納米制程技術(shù)之上,在提高能效的同時(shí),,具有更卓越的性能和能力,。整合顯示核心是Sandy Bridge處理器的一大改進(jìn)。

    Sandy Bridge微構(gòu)架采用了可擴(kuò)展的環(huán)形互連架構(gòu),,將內(nèi)核,、最后一集高速緩存LLC和系統(tǒng)代理互連在一起,并且通過(guò)環(huán)上的數(shù)據(jù)存取總是選擇最短路徑,,這樣可以最小化延遲,。另外,環(huán)形的互連架構(gòu)讓Sandy Bridge具有更高的可擴(kuò)展性,,可以支持大量的處理器,。Sandy Bridge架構(gòu)的優(yōu)勢(shì)集中在:能效,性能優(yōu)化,,聯(lián)合CPU進(jìn)行了優(yōu)化,,增強(qiáng)的固有優(yōu)勢(shì)和媒體性能。

    其前端微架構(gòu)的處理順序?yàn)椋?2K一級(jí)緩存>預(yù)譯碼>指令隊(duì)列>譯碼器>分支預(yù)測(cè)單元,。其中一級(jí)緩存為32KB的8路相連指令高速緩存,,譯碼器部分包含4個(gè)譯碼器,每個(gè)時(shí)鐘周期可處理器4條指令,,指令隊(duì)列處理方式包括微融合和宏融合,,可將多條指令時(shí)間打包為一條“微操作”或?qū)⒍鄬?duì)指令融合為一條復(fù)雜的“位操作”,譯碼流水線支持每個(gè)時(shí)鐘周期16個(gè)字節(jié),。

第二代酷睿微加構(gòu)解析

    此外,,在前端微架構(gòu)處理器單元中還增加了一個(gè)譯碼微操作高速緩存,稱之為0級(jí)(L0)指令高速緩存,,代替了指令字節(jié),,對(duì)于大多數(shù)應(yīng)用高達(dá)80%的命中率,此外,,新架構(gòu)還帶來(lái)了更高的指令帶寬和更低的延遲,。譯碼高速緩存可以在每個(gè)時(shí)鐘周期遞送32字節(jié),更多時(shí)鐘周期可以保持每個(gè)周期4條指令,,并能夠縫合控制流程間的分支,,從而達(dá)到更高的效能。

    整合顯示核心可說(shuō)是是Sandy Bridge處理器的又一改進(jìn)。與Westmere處理器所使用的MXM技術(shù)不同,,Sandy Bridge處理器率先實(shí)現(xiàn)了將顯示模塊完全集成于芯片內(nèi)部,,并允許其通過(guò)Ring Bus(環(huán)形總線)與處理器模塊共享三級(jí)緩存,以提升整體性能,。

革命性的進(jìn)步:核心顯卡

    全新的Sandy Bridge圖形核心采取了統(tǒng)一的顯卡-CPU電源管理,,可在CPU顯卡之間的資源分配上達(dá)到最優(yōu)決策,從而提升效能,,在顯卡中使用了CPU登記的電源管理技術(shù),。獨(dú)立的顯卡和CPU電源控制允許電源按工作量需求進(jìn)行分配,其電壓和時(shí)序都是獨(dú)立于CPU的。

革命性的進(jìn)步:核心顯卡

    固定的模塊計(jì)算能達(dá)到最優(yōu)平衡,,在3D管道中每個(gè)點(diǎn)都有外在的固定功能模塊,,從而達(dá)到低延時(shí)、高吞吐量,、簡(jiǎn)單的驅(qū)動(dòng)編程模型,,同時(shí)釋放著色器,令其專注于渲染工作,。

革命性的進(jìn)步:核心顯卡

    特別是新一代的EU擁有更大的寄存器文件以提高并行度和復(fù)雜著色器的執(zhí)行效率,,對(duì)深度嵌套條件也能有效優(yōu)化,數(shù)學(xué)計(jì)算能力提高了4~20倍,,新的指令集與API,、ISA一一對(duì)應(yīng),從而在同頻率下達(dá)到更高效率,。固定模塊的設(shè)計(jì)去掉了正交狀態(tài),,與上代產(chǎn)品相比,驅(qū)動(dòng)運(yùn)行時(shí)間大幅降低,,釋放了CPU負(fù)載,,將能量更多分配到顯卡上。

革命性的進(jìn)步:核心顯卡

    比如在高清視頻解碼方面,,英特爾所采用的支持多格式編解碼器---MFX則是一種專用并行引擎,。該引擎除了支持MPEG2、VC1以及AVC等常見編碼格式還提供了對(duì)立體3D(MVC)的支持,。而憑借MFX引擎的有力支持,,CPU本身的負(fù)載也得到了進(jìn)一步優(yōu)化。

酷睿加速2.0技術(shù)解析

    與上一代睿頻加速1.0技術(shù)相比,,睿頻加速2.0技術(shù)的設(shè)計(jì)方向更多的針對(duì)多線程應(yīng)用,,不僅能夠提供更高的多線程加速頻率,而且調(diào)節(jié)機(jī)制更具彈性,。當(dāng)啟動(dòng)一個(gè)運(yùn)行程序后,處理器會(huì)自動(dòng)加速到合適的頻率,而原來(lái)的運(yùn)行速度會(huì)提升 10%—20% 以保證程序流暢運(yùn)行,;應(yīng)對(duì)復(fù)雜應(yīng)用時(shí),,處理器可自動(dòng)提高運(yùn)行主頻以提速,輕松進(jìn)行對(duì)性能要求更高的多任務(wù)處理,;當(dāng)進(jìn)行工作任務(wù)切換時(shí),,如果只有內(nèi)存硬盤在進(jìn)行主要的工作,處理器會(huì)立刻處于節(jié)電狀態(tài),。這樣既保證了能源的有效利用,,又使程序速度大幅提升。 

酷睿加速2.0技術(shù)解析

     而值得注意的是,,雖然設(shè)計(jì)在同一個(gè)芯片上,,但是Sandy Bridge的CPU和GPU使用分別的電壓和頻率,共同分擔(dān)芯片的整體功耗,,通過(guò)功耗預(yù)算,,CPU和GPU之間的調(diào)整使得在不同應(yīng)用中始終保持最佳的分配,當(dāng)CPU負(fù)載重時(shí),,GPU的能耗則相應(yīng)降低,,反之亦然。

關(guān)鍵字:英特爾 IDF2011 SandyBridge平臺(tái)

    在多媒體指令集方面,,Sandy Bridge增加了Intel AVX指令集,,使用了新的執(zhí)行群集、存儲(chǔ)器群集,,可以擴(kuò)展SSE浮點(diǎn)指令集到256bit的操作數(shù),,采用新的無(wú)損源語(yǔ)法和矢量運(yùn)算,是面向低功耗的架構(gòu),,矢量對(duì)于許多應(yīng)用語(yǔ)言都是自然的數(shù)據(jù)類型,,更寬的矢量和無(wú)損源語(yǔ)可用更少的指令詳細(xì)描述更多的工作,使得現(xiàn)有工作得到有效擴(kuò)展,。Sandy Bridge的浮點(diǎn)運(yùn)算能力大幅增加,。AVX指令集可以利用2組128bit執(zhí)行棧,令執(zhí)行群集重新使用現(xiàn)有數(shù)據(jù)路徑達(dá)到雙重使用的目的,。

    在渲染的時(shí)候,,光線跟蹤也好,光能傳遞也好都需要大量的計(jì)算,,這些工作都是由CPU提供的,。而核內(nèi)顯卡在3D管道中每個(gè)點(diǎn)都有外在的固定功能模塊,從而達(dá)到低延時(shí),、高吞吐量,、簡(jiǎn)單的驅(qū)動(dòng)編程模型,,同時(shí)釋放著色器,令其專注于渲染工作,。


高精度星球?yàn)g覽器的現(xiàn)場(chǎng)演示

    除了核心顯示在設(shè)計(jì)上的優(yōu)勢(shì),,英特爾的技術(shù)人員特別演示了“高精度星球?yàn)g覽器”的應(yīng)用案例。無(wú)論是在第二代英特爾酷睿i5還是i7處理器中,,其內(nèi)建的核心顯卡均可以在高負(fù)荷的應(yīng)用下完成星球整體以及地表的圖形建模與高精度實(shí)時(shí)渲染,。在高符合的渲染過(guò)程中,第二代酷睿處理器所采用雙精度英特爾 高級(jí)矢量擴(kuò)展指令集(AVX)則是憑借四線程,、64位的優(yōu)化能力大大提升了整個(gè)過(guò)程的執(zhí)行速度,,而這一優(yōu)勢(shì)是上一代產(chǎn)品所不具備的。

    英特爾早在今年第一季度正式發(fā)布基于Sandy Bridge架構(gòu)設(shè)計(jì)的處理器產(chǎn)品,,事實(shí)上早在去年9月底的IDF 2009舊金山站上,,英特爾的高管StephenSmith就已經(jīng)拿出了桌面和移動(dòng)版本的Sandy Bridge處理器實(shí)物,要知道那個(gè)時(shí)候甚至就連現(xiàn)在的32nm Westmere還沒(méi)有正式發(fā)布呢,,英特爾也借此表達(dá)了充分貫徹Tick-Tock策略的決心,。

總結(jié)及IT168評(píng)測(cè)中心觀點(diǎn)

    而時(shí)至今日,在新一代SNB平臺(tái)已經(jīng)全面捕貨的同時(shí)時(shí)候,,我們看到作為Nehalem的繼任者,,在實(shí)際應(yīng)用方面,代號(hào)為Sandy Bridge的處理器在硬件特性方面還有著更多成長(zhǎng)空間,。憑借全新的處理架構(gòu),,更加智能的睿頻技術(shù),全新的AVX指令集,,SNB可在家庭娛樂(lè),、日常辦公甚至服務(wù)器市場(chǎng)有著更多值得驚喜的表現(xiàn),特別是其核內(nèi)顯卡在圖形以及并行處理應(yīng)用的改善讓我們對(duì)這一架構(gòu)發(fā)展有著更多的期待,。

 

此內(nèi)容為AET網(wǎng)站原創(chuàng),,未經(jīng)授權(quán)禁止轉(zhuǎn)載。