來源:內(nèi)容來自「鳳凰科技花子健」,謝謝,。
北京時(shí)間3月28日凌晨00:00,英偉達(dá)GTC 2018(GPU Technology Conference 2018,,以下簡(jiǎn)稱GTC)在美國(guó)圣何塞舉行,。英偉達(dá)再一次在提升計(jì)算力的路上越走越遠(yuǎn)。GPU產(chǎn)品依然是主旋律,,Tesla V100系列、DGX系列和Quadro GPU系列都進(jìn)行了更新,。
鳳凰網(wǎng)科技 花子健 發(fā)自美國(guó)圣何塞
新產(chǎn)品—全世界最大的GPU只要399
全新Tesla V100顯存將從原來的16GB提升至32GB,。2017年5月11日,英偉達(dá)正式發(fā)布了全新Volta架構(gòu)GPU——NVIDIA Tesla V100,,它擁有超過210億個(gè)晶體管,,是上代TeslaP100的1.37倍。它的單精度浮點(diǎn)性能高達(dá)15 TFLOPS,,雙精度浮點(diǎn)7.5 TFLOPS,。
基于此前的NVIDIA NVLink架構(gòu),英偉達(dá)還推出了全新的NVSwitch架構(gòu),。這一互聯(lián)架構(gòu)的帶寬比PCle交換機(jī)高5倍,,足以支持更大規(guī)模和復(fù)雜的數(shù)據(jù)集運(yùn)算,讓開發(fā)者和科學(xué)家可以構(gòu)建更高級(jí)的系統(tǒng),。
基于Tesla V100的升級(jí)和全新的NVSwitch架構(gòu),,英偉達(dá)將DGX 2的性能較前一代產(chǎn)品有大幅度提升。
在2016年的GTC上英偉達(dá)正式發(fā)布DGX 1,,它擁有8顆帕斯卡架構(gòu)GP100核心的Tesla P100 GPU,,以及7TB的SSD,由兩顆16核心的Xeon E5-2698v3以及512GB的DDR4內(nèi)存驅(qū)動(dòng),。售價(jià)為129000美元,。2017年9月份,英偉達(dá)推出了一款基于Volta架構(gòu)的DGX 1V,,擁有8塊Tesla V100,。
而DGX 2應(yīng)用了最新的NVSwitch架構(gòu),通過12個(gè)NVSwitch支持16塊全新的Tesla V100共享同一的內(nèi)存空間,,總計(jì)512 GB HBM2存儲(chǔ),,能實(shí)現(xiàn)每秒高達(dá)2千萬(wàn)次的浮點(diǎn)運(yùn)算。此外,,基于NVSwitch架構(gòu)的應(yīng)用,,16塊GPU可以實(shí)現(xiàn)2.4TB/秒的數(shù)據(jù)傳輸能力,。
DGX 2內(nèi)含16顆Tesla V100芯片
“這是全球最大的GPU?!秉S仁勛表示,,他還用“美麗、性感”等詞語(yǔ)來形容這一款最新的DGX系列產(chǎn)品,。
DGX 2的售價(jià),,黃仁勛首先給出的是150萬(wàn)美元,最后直接減價(jià)為39.9萬(wàn)美元,,將在今年的第三季度正式開放購(gòu)買,。
面向藝術(shù)及設(shè)計(jì)領(lǐng)域,英偉達(dá)還推出了搭載了NVIDIA RTX(實(shí)時(shí)光線追蹤)技術(shù)的NVIDIA Quadro GV100 GPU,。單塊GPU擁有32GB內(nèi)存,,可以基于NVLink技術(shù)將兩塊GV100 GPU并聯(lián),從而將內(nèi)存提升至64GB,。在前一周的游戲開發(fā)者大會(huì)上,,英偉達(dá)正式推出了NVIDIA RTX技術(shù)。
GV100 GPU基于最新的Volta架構(gòu),,可以提供每秒7.4萬(wàn)億次浮點(diǎn)運(yùn)算的雙精度性能,,每秒14.8萬(wàn)億次浮點(diǎn)運(yùn)算的單精度性能,以及每秒118.5萬(wàn)億次浮點(diǎn)運(yùn)算的深度學(xué)習(xí)性能,。
黃仁勛手中的GV100 GPU
這款產(chǎn)品主要針對(duì)傳媒娛樂從業(yè)者,、產(chǎn)品設(shè)計(jì)師、建筑設(shè)計(jì)師等專業(yè)設(shè)計(jì)與流媒體專業(yè)人員,。其中,,NVIDIA RTX內(nèi)置的NVIDIA OpitX AI-denoiser可以實(shí)現(xiàn)實(shí)時(shí)的AI降噪去噪。
硬件之外,,英偉達(dá)還發(fā)布了針對(duì)軟件的更新——TensorRT 4軟件,。這一軟件可用于優(yōu)化、驗(yàn)證和部署在超大規(guī)模數(shù)據(jù)中心,、嵌入式與汽車GPU平臺(tái)中經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò),。
為了籠絡(luò)更多的開發(fā)者,英偉達(dá)與谷歌的工程師將TensorRT集成至谷歌的TensorFlow 1.7中,。
自動(dòng)駕駛—暫停自動(dòng)駕駛研發(fā)
自動(dòng)駕駛?cè)栽诒敬蜧TC的討論之列
英偉達(dá)的自動(dòng)駕駛平臺(tái)可以統(tǒng)稱為Drive PX系列,。但是其實(shí),Drive PX只是NVIDIA車載AI平臺(tái)的系列名稱,。而這個(gè)系列目前主要包括兩代產(chǎn)品:已經(jīng)量產(chǎn)的Drive PX 2平臺(tái),,以及在2018年初展示的新一代平臺(tái)Xavier。
不過黃仁勛卻在GTC 2018上宣布英偉達(dá)將暫停自動(dòng)駕駛的研發(fā)工作,,雖然沒有說明何時(shí)能再推進(jìn)這一進(jìn)程,,但是他也表示“不會(huì)太久,。”
在2018年2月9日對(duì)外發(fā)布的2018財(cái)年第四季度及全年財(cái)報(bào)中,,英偉達(dá)曾經(jīng)提到過與Uber,、Aurora合作打造自動(dòng)駕駛汽車,采用的就是開源的NVIDIA Drive人工智能自動(dòng)駕駛平臺(tái),。
美國(guó)當(dāng)?shù)貢r(shí)間3月18日晚上,,亞利桑那州一名女子被Uber自動(dòng)駕駛汽車撞傷,之后不幸身亡,。這是全球首例自動(dòng)駕駛車輛致人死亡的事故,,隨后Uber宣布將暫停其在美國(guó)和加拿大的自動(dòng)駕駛項(xiàng)目。隨后在26日,,亞利桑那州州長(zhǎng)宣布暫禁Uber在亞利桑那州公路測(cè)試自駕車,。
黃仁勛在回答媒體關(guān)于該案件的提問時(shí)表示,英偉達(dá)對(duì)于這個(gè)意外感到悲傷,,但是自動(dòng)駕駛的研究本身是沒有錯(cuò)的,,應(yīng)該從這個(gè)案件中吸取經(jīng)驗(yàn),,提升自動(dòng)駕駛的安全性,。作為Uber在自動(dòng)駕駛領(lǐng)域的合作方之一,英偉達(dá)暫停自動(dòng)駕駛的研發(fā)可能和Uber的自動(dòng)駕駛汽車撞人致死案有關(guān),,但其并沒有完全放棄自動(dòng)駕駛項(xiàng)目,。
英偉達(dá)的DRIVE Constellation仿真系統(tǒng)
英偉達(dá)在GTC上推出了針對(duì)自動(dòng)駕駛汽車測(cè)試的仿真系統(tǒng)——DRIVE Constellation。
DRIVE Constellation仿真系統(tǒng)是一套使用照片級(jí)真實(shí)感模擬,,基于云的自動(dòng)駕駛汽車測(cè)試系統(tǒng),。它基于兩個(gè)不同的服務(wù)器,第一臺(tái)服務(wù)器運(yùn)行的是DRIVE Sim軟件,,可以模擬自動(dòng)駕駛汽車的傳感器,,比如攝像頭、激光雷達(dá)和雷達(dá)等,。
DRIVE Sim軟件可以通過生成照片級(jí)的數(shù)據(jù)流,,從而創(chuàng)建不同的測(cè)試環(huán)境,比如晴天,、暴雨,、暴雪等不同的天氣狀況、日間和夜間等不同的光線狀況,、急轉(zhuǎn)彎或陡坡等不同的路面狀況,。并且在模擬過程中設(shè)置各種危險(xiǎn)和突發(fā)狀況,比如行人突然穿越馬路等,,以測(cè)試自動(dòng)駕駛汽車的反應(yīng)能力,,以確定其不會(huì)對(duì)人帶來安全威脅,。
第二臺(tái)服務(wù)器搭載的是NVIDIA DRIVE Pegasus AI汽車計(jì)算平臺(tái),運(yùn)行完整的自動(dòng)駕駛汽車軟件堆棧,,并能夠處理傳感器搜集模擬數(shù)據(jù),。經(jīng)過處理的數(shù)據(jù)會(huì)被反饋給傳感器,一直進(jìn)行數(shù)據(jù)的循環(huán),。
從時(shí)間來看,,英偉達(dá)推出的這個(gè)仿真系統(tǒng)和Uber的自動(dòng)駕駛汽車撞人致死案并無太大關(guān)聯(lián),不過在長(zhǎng)遠(yuǎn)的未來,,它將能有效幫助提升自動(dòng)駕駛汽車測(cè)試的安全性,。
新合作—與ARM合作布局IoT
英偉達(dá)還宣布與ARM達(dá)成了合作,共同為全球數(shù)十億臺(tái)IoT設(shè)備提供深度學(xué)習(xí)的能力,。雙方將開源的英偉達(dá)深度學(xué)習(xí)加速器整合到ARM的Project Trillium機(jī)器學(xué)習(xí)平臺(tái)上,。
2018年2月23日,ARM推出了Project Trillium項(xiàng)目,,這是一套包括新的高度可擴(kuò)展處理器的ARM IP組合,,這些產(chǎn)品可以提供增強(qiáng)的機(jī)器學(xué)習(xí)(ML)和神經(jīng)網(wǎng)絡(luò)(NN)功能。當(dāng)前的技術(shù)產(chǎn)品主要針對(duì)移動(dòng)設(shè)備市場(chǎng),,將讓全新的搭載機(jī)器學(xué)習(xí)功能的設(shè)備具有先進(jìn)的計(jì)算能力,,包括先進(jìn)的目標(biāo)檢測(cè)功能。
在將英偉達(dá)深度學(xué)習(xí)加速器整合到Project Trillium之后,,全球數(shù)十億臺(tái)的消費(fèi)電子設(shè)備上的IoT芯片將具備機(jī)器學(xué)習(xí)能力,。
GTC之外—計(jì)算力提升從創(chuàng)新驅(qū)動(dòng)變?yōu)樾枨篁?qū)動(dòng)
提到英偉達(dá)和黃仁勛,就不得不提到CPU,。在2017年的GTC上,,黃仁勛曾聲稱摩爾定律已經(jīng)終結(jié),設(shè)計(jì)人員無法再創(chuàng)造出可以實(shí)現(xiàn)更高指令集并行的GPU架構(gòu),,晶體管數(shù)量每年增長(zhǎng)50%,,但CPU的性能每年僅增長(zhǎng)10%。
在演講中,,黃仁勛沒有放過任何一次揶揄CPU的機(jī)會(huì),。不管是更新后的Tesla V100、DGX 2,,還是最新發(fā)布的GV100 GPU,,黃仁勛聲稱“在提供相同的計(jì)算力下,它們都比CPU組成的集群要更節(jié)能,、高效,,占用更少的空間。”
“買得越多,,省得越多,。”已經(jīng)成了他的口頭禪,。然而回歸到英偉達(dá)本身,,其本身的高速增長(zhǎng)很大一部分是依賴于市場(chǎng)對(duì)圖形芯片的巨大需求。
在英偉達(dá)公布的2018財(cái)年第四季度財(cái)報(bào)中,,雖然數(shù)據(jù)中心業(yè)務(wù)同比實(shí)現(xiàn)了一倍多的增長(zhǎng)達(dá)到6.06億美元,。但游戲圖形芯片業(yè)務(wù)的營(yíng)收達(dá)17.4億美元,同比增長(zhǎng)29%,,占該季度總營(yíng)收的一半以上,。
“加密貨幣市場(chǎng)的強(qiáng)勁需求超出了我們的預(yù)期?!?英偉達(dá)首席財(cái)務(wù)官科萊特·克雷斯表示,,“盡管加密貨幣對(duì)我們業(yè)務(wù)的總體貢獻(xiàn)仍難以量化,但我們認(rèn)為,,其在營(yíng)收中所比例高于上一季度,。”
從產(chǎn)品本身來說,, GPU目前只能是不斷疊加性能,,帶來的驚喜越來越少。以DGX系列為例,,內(nèi)含的GPU芯片從4顆變成了8顆,,今年從8顆增長(zhǎng)到了16顆,,改變的只不過是互聯(lián)的架構(gòu),。單顆芯片的算力提升越來越難,英偉達(dá)的“橫向發(fā)展”只是另辟蹊徑,。
不過,,英特爾的Nervana芯片,谷歌的TPU(目前只在谷歌內(nèi)部使用)對(duì)于英偉達(dá)來說是潛在的競(jìng)爭(zhēng)對(duì)手,。有競(jìng)爭(zhēng)在,,更大的驚喜才有可能會(huì)到來。