光線追蹤是指在模擬場景中對若干條模擬光線進行單獨追蹤,,模擬光線其與場景中物體、物體表面材質(zhì)的交互,,從而達到全局照明場景中更真實的渲染效果,。相比傳統(tǒng)的光柵化渲染的方式,光線追蹤雖然效果更好但同時對于計算資源的需求更高,,傳統(tǒng)軟件實現(xiàn)方式并不能大規(guī)模普及開來,。英偉達在2018年推出了通過硬件加速來實現(xiàn)實時光線追蹤的桌面級GPU,,這可以看作是GPU領(lǐng)域的一次重大突破。而今時隔3年之后,,Imagination推出了全新的移動GPU平臺——C系列,,通過全新的“光子”架構(gòu)讓光線追蹤進入到了移動端,成為GPU史上又一次的重大邁進,。
圖:Imagination提供的是否開啟實時光線追蹤的效果對比*
克服光線追蹤進入移動端的難點
由于光線追蹤對于計算資源有著很高的要求,,而移動端又非常注重功耗的表現(xiàn),所以光線追蹤功耗表現(xiàn)是其進入移動端的第一難題,。據(jù)Imagination技術(shù)前瞻副總裁Kristof Beets分享,,移動端面臨的限制很多,一方面核心的數(shù)量沒有辦法無限疊加,,發(fā)熱和功耗都會成為很大的問題,。Imagination新推出的具有光線追蹤功能的C系列GPU IP,它有專門的硬件部分把光線追蹤相關(guān)的計算分流到光線追蹤的硬件上,,來實現(xiàn)光線追蹤的效果,。其中包括光線的反射、陰影,、全局照明和環(huán)境光的遮蔽,。總體上可以達到整個顯示效果的極大提升,,同時保留原來非常低的功耗和效率。
Imagination將新的光線追蹤架構(gòu)命名為“光子”,。據(jù)Imagination中國區(qū)戰(zhàn)略市場與生態(tài)副總時昕博士分享,,“去創(chuàng)造一個新的宇宙,大家第一個想到的概念是什么,?我想到上帝說的一句話”要有光“,。我們要創(chuàng)造一個全新的虛擬世界,我們第一個需要的東西也是光,,所以我們把新的光線追蹤的架構(gòu)命名為光子,。”新的“光子”GPU架構(gòu)這個專門用來進行光線追蹤處理的硬件單元叫做RAC(光線加速集群),,通過該硬件的加速可以實現(xiàn)傳統(tǒng) 方式數(shù)倍的提升,,各項性能幾乎都能提高50%。以32位的CXTRT3舉例:每秒鐘可以計算13億條光線的折射,、反射,,每秒算力達到1.5T,48G像素/s,、紋理運算1.3G/s,、48GBoxTest,;如果做AI定點運算每秒可以達到6TOPS。
在場景的渲染上,,越真實的體驗需要調(diào)度越多的硬件資源,。根據(jù)不同的渲染等級,RAC中的不同硬件加速模塊會相應(yīng)的被調(diào)用,,把光線遍歷,、追蹤和監(jiān)控算法通過專用的硬件來實現(xiàn)。當全局光照打開,,數(shù)億條光線打到物體上,,將會產(chǎn)生非常大的計算量。Imagination會將數(shù)億條光線通過分組的形式來進行計算,,從而提高計算的效率,。分組計算后的結(jié)果通過一致性檢測硬件來進行簇化,將畫面提升到最佳,。
將全新的RAC與之前B系列中的USC,、TPU等放在一起,就可以組成一個具備光線追蹤能力的移動GPU,。據(jù)悉,,CXT支持多核架構(gòu)來實現(xiàn)更高的性能表現(xiàn),例如4核架構(gòu)最多可以達到7.8G Ray/s,,同時還可以選擇用專門神經(jīng)網(wǎng)絡(luò)加速器單元去做降噪的處理,,將更多的資源去做圖形相關(guān)的渲染計算。此外Imagination也開發(fā)了相應(yīng)的軟件工具,,開發(fā)者可以查看每秒的光線數(shù),,測試的負載等;另外還有一個為內(nèi)容開發(fā)者提供的軟件開發(fā)套件,,功能類似于跑在PowerVR上模擬出的效果,。
光線追蹤的大規(guī)模應(yīng)用之路
光線追蹤的思路很早就已經(jīng)出現(xiàn),但受制于計算資源的需求較大,,一直沒能得到很大規(guī)模應(yīng)用,。而且在前期碎片化問題嚴重,一些方案均來自自有API或軟件方案,,這意味著內(nèi)容開發(fā)者并不難在后臺大量應(yīng)用這些技術(shù),。專用的硬件加速的出現(xiàn)使其成為了可能,英偉達的硬件加速光線追蹤桌面級GPU的發(fā)布是一個節(jié)點,,讓硬件方案進入市場并得到認可,。而今Imagination的光線追蹤移動GPU的發(fā)布,是一個更為重要的節(jié)點,,帶來了光追的大規(guī)模應(yīng)用爆發(fā)的可能,。
為了進一步推進光追的普及,,Imagination率先提出了一個光追的分級體系,如下圖所示:0級為傳統(tǒng)方案,,可能是在圖形工作站上進行幾個小時的畫面渲染,,可能也會有一些專業(yè)的非標準化的硬件來加速。1級是后來業(yè)界在將光追算法向GPU上逐漸遷移,,將CPU版本軟件轉(zhuǎn)換成GPU的版本,,借助GPU的并行計算能力來獲得數(shù)量級加速。2級中出現(xiàn)了更多細致的光線處理的新的方式,,3級中出現(xiàn)了硬件BVH處理能力,。據(jù)時昕博士分享,目前行業(yè)中即使是PC上的光追,,大概就在2,、3級的水平。第4級別是當前Imagination所發(fā)布的新產(chǎn)品可以達到的,,這是全球第一次達到該級別的硬件處理能力,。第5級上會進一步將會更多計算工作負荷從原來的GPU的渲染器或著色器中分離出來,轉(zhuǎn)移到專門的硬件上去加速,,從而省下更多的GPU資源來做其他動態(tài)渲染,,這樣可以在性能提升的同時降低功耗。
其實Imagination已經(jīng)具備直接推出L5級別光追方案的能力,,但由于現(xiàn)在市場并不成熟所以并沒有推出,。Kristof表示,沒有選擇現(xiàn)階段推出L5級產(chǎn)品主要為了市場平衡考慮,,Imagination跟市面上的光線追蹤開發(fā)者有過溝通,,如果現(xiàn)在推出市場上唯一的L5等級光線追蹤硬件設(shè)備,因為市場沒有準備所以不會有太多開發(fā)者來開發(fā)相應(yīng)的應(yīng)用,。所以Imagaination決定先推出L4級別的CXT產(chǎn)品來培育市場,讓游戲3D引擎,、游戲開發(fā)者進入到生態(tài)中,,再慢慢把光線追蹤市場做大。在標準方面,,現(xiàn)在市場上已經(jīng)出現(xiàn)了一些光線追蹤技術(shù)趨向于標準化,、統(tǒng)一化的趨勢。時昕表示,,處理器的成功離不開整個生態(tài),,包括接口,包括編程的模式,、工具等等,。整個光追生態(tài)其中一個重要因素——API標準已經(jīng)成型,,包括Vulkan都有相關(guān)的標準出來,Imagination的硬件提供了可能性,,上層內(nèi)容開發(fā)者和工具開發(fā)者,,也會遵循同樣的光線追蹤標準,相信很快會有很多豐富的內(nèi)容出現(xiàn),。Imagination也積極與微軟等合作伙伴進行密切的溝通,,在此基礎(chǔ)上繼續(xù)提升GPU架構(gòu)追求更好的PPA表現(xiàn)。
###
據(jù)悉諸多客戶已經(jīng)獲得了最新CXT的IP授權(quán),,按照正常的產(chǎn)品研發(fā)周期推算,,消費者有望在2023年在移動設(shè)備上體驗到硬件光線追蹤方案。