一年一度的Hotchips一直是工業(yè)界的風(fēng)向標(biāo),,雖然參加的人數(shù)并不是很多,,但是高性能芯片行業(yè)的領(lǐng)頭羊每年都借著這個(gè)機(jī)會(huì)展示自己公司的最新成果。今年因?yàn)橐咔椋麄€(gè)大會(huì)搬到線上舉行,,但內(nèi)容仍然精彩,。這次第32屆會(huì)議歷時(shí)三天,,其中兩天是正式會(huì)議,,會(huì)議之前還有一天的Tutorial。會(huì)議第一天分為五大部分(session):Server processors, Mobile Processors, Edge Computing and sensing, GPUs and Gaming Architectures. 第二天的話(huà)題則覆蓋 FPGA and reconfigurable Architecture, Networking and Distributed Systems, ML training, ML inference. 讓我們來(lái)具體看看整個(gè)會(huì)議反映出來(lái)當(dāng)前主流芯片業(yè)界的主要看點(diǎn)吧,。
臺(tái)積電(TSMC) 7納米
會(huì)議所有的報(bào)告都是基于已經(jīng)tape out的芯片,,有的是新鮮熱辣剛剛出爐,,有的是已經(jīng)投入應(yīng)用??v觀所有的報(bào)告芯片,,最先想到的關(guān)鍵詞就是 TSMC 7納米。包括Marvel, AMD, Nvidia, Microsoft, Xilinx和Barefoot的芯片都是用 TSMC 7nm FinFet 工藝,,有的片子現(xiàn)在用的工藝不是這個(gè)工藝,但主講人也特別提及到下一代芯片會(huì)用TSMC 7nm. 這也反映出來(lái)TSMC在工藝上的主導(dǎo)地位,,他家的最新工藝基本上就是行業(yè)高性能芯片的首選,。在這里提一句題外話(huà),前一段時(shí)間財(cái)富全球前500出爐的時(shí)候,,TSMC的盈利率在500企業(yè)中排名第一,,達(dá)到31%, 比第二名的巴菲特Berkshire Hathaway投資公司還高。TSMC作為一個(gè)傳統(tǒng)制造業(yè)企業(yè),,創(chuàng)造了這個(gè)盈利率成績(jī)實(shí)在是讓人刮目相看,,也是巨大的研發(fā)投入做到行業(yè)第一帶來(lái)的巨大回報(bào)的典型商業(yè)成功案例。
表 : 各家芯片的工藝統(tǒng)計(jì)
Intel 仍是業(yè)界的龍頭
Intel這一兩年來(lái)真是流年不利,,10nm工藝雖然在起初公布的時(shí)候和TSMC 7nm集成度相當(dāng),,但是在良率上一直存在問(wèn)題導(dǎo)致10nm產(chǎn)品一拖再拖難產(chǎn)。而在移動(dòng)cpu市場(chǎng)上更加被AMD侵蝕,,往日的X86 CPU江湖大佬地位岌岌可危,。這次會(huì)議第一天的主題演講(Key Note)還是由Intel的首席架構(gòu)師 Raja Koduri主講。這樣的安排除了是因?yàn)镮ntel是會(huì)議的唯一最高長(zhǎng)銠級(jí)(Rhodium) 贊助商外,,業(yè)界對(duì)Intel還是相當(dāng)?shù)木粗氐?,希望Intel在后摩爾時(shí)代能帶領(lǐng)行業(yè)繼續(xù)前進(jìn)。Raja的演講的確是高屋建瓴,,回顧過(guò)去,,展望將來(lái),摩爾定律沒(méi)死,!而在演講末尾展示出來(lái)的一些從器件到封裝各級(jí)的集成度仍然還有巨大提升的空間,,而且這些集成已經(jīng)是在實(shí)驗(yàn)室實(shí)現(xiàn)了的。當(dāng)然了,,量產(chǎn)良率和成本是另一回事,。大家聽(tīng)到這些消息還是大大的被打了雞血的。這篇主題演講還時(shí)不時(shí)提及剛剛宣布離職的cpu設(shè)計(jì)大佬Jim Keller, 讓人唏噓不已,。要知道這個(gè)主題演講本來(lái)是安排給Jim Keller主講的,,因?yàn)镴im突然離職而臨時(shí)換了人。
而在產(chǎn)品方面,,Intel也不負(fù)眾望,,推出了下一代 Tiger Lake 移動(dòng)CPU, Xe架構(gòu)的GPU,, Agilex FPGA 和Tofino2高速交換機(jī)芯片。每一樣都是拳頭主打,,性能直接硬拼對(duì)手,。其中重頭戲是Tiger Lake CPU, 在問(wèn)答的時(shí)候Intel幾乎避開(kāi)所有的問(wèn)題,只說(shuō)待到九月2號(hào)正式發(fā)布的時(shí)候才有更多具體資料,。到時(shí)候Intel會(huì)不會(huì)推出一款 12/16 cores的移動(dòng)CPU搶回筆記本的地盤(pán),?讓我們拭目以待。
RISC-V
RISC-V架構(gòu)提出多年,,而且在技術(shù)上被抱以厚望,。但是這些年工業(yè)界的推動(dòng)力明顯不夠,目前的商業(yè)化狀態(tài)還是讓人比較失望的,??上驳氖窃贖otchips這樣的行業(yè)會(huì)議上人們?nèi)匀粵](méi)有忘記它。這次會(huì)議有兩篇RISC-V的演講,,一是阿里巴巴的玄鐵-910, 另一個(gè)是蘇黎世聯(lián)邦理工學(xué)院的4096 cores MantiCore. 玄鐵-910采用TSMC 12納米的工藝,,運(yùn)行主頻可達(dá)2.5GHz. 阿里巴巴也開(kāi)發(fā)出來(lái)了自己的RISC-V編譯器進(jìn)一步優(yōu)化系統(tǒng)性能,在 EEMBC 和 nBench 大部分項(xiàng)目性能指標(biāo)上都超越了 Arm Cortex A73. 而MantiCore是靠多Core并行并提高了浮點(diǎn)計(jì)算的效率,,fp64 效率是其它幾個(gè)芯片的數(shù)倍,,而fp32效率也普遍比其它CPU/GPU要高。這個(gè)芯片將在ML領(lǐng)域上大有可為,。
會(huì)議里也有好幾個(gè) ARM 架構(gòu)的芯片演講,, 作為當(dāng)前市場(chǎng)的主導(dǎo)者,ARM的市場(chǎng)占有率還是完全超越 RISC-V 架構(gòu)的,。而軟銀要出售ARM的消息目前還不明朗,,Nvidia收購(gòu)的呼聲很高。筆者認(rèn)為,,ARM目前作為一家獨(dú)立運(yùn)營(yíng)公司,,其商業(yè)模式是license自家的arm 架構(gòu)。ARM和其客戶(hù)之間并沒(méi)有什么產(chǎn)品層面的競(jìng)爭(zhēng),。但如果一家芯片公司Nvidia收購(gòu)arm之后,,勢(shì)必會(huì)改變這種勢(shì)態(tài)。不排除Nvidia的競(jìng)爭(zhēng)者為了區(qū)分自己的產(chǎn)品而撇棄ARM而選擇其它架構(gòu),。這樣看來(lái)如果收購(gòu)成功,,說(shuō)不定能成為RISC V 在工業(yè)界推廣的一大契機(jī)。
AI, ML
AI和ML的硬件化概念已經(jīng)提出來(lái)了一段時(shí)間,,但是強(qiáng)勁的市場(chǎng)需要還是把這兩個(gè)領(lǐng)域留在芯片熱點(diǎn),。這次會(huì)議的第二天的主題演講也是留給了AI巨頭DeepMind公司的 Dan Belov. 這篇主題演講回顧了AI 發(fā)展的過(guò)去和目前遇到的瓶頸,也深入講解了一下當(dāng)前的 Encoder -> Processor -> Decoder 的 通用ML 架構(gòu),。同時(shí)也感慨當(dāng)前硬件的算力趕不上 AI 發(fā)展的需要,,而軟件方面仍然低效,。2020年 AI 的一個(gè)應(yīng)用會(huì)不會(huì)是編譯器的優(yōu)化呢?讓我們拭目以待,。
而會(huì)議也特別安排了兩個(gè) ML 的專(zhuān)題,,分別為 ML traning 和 ML interence. 各家都展現(xiàn)出各自的看家本領(lǐng)。其中有Google家的 TPU v2 和 TPU v3, 把 Tensorflow的算力進(jìn)一步大大提升,。其中 TPU v2開(kāi)始把 單處理器模式的 TPU v1 擴(kuò)展到可以堆和的超級(jí)計(jì)算機(jī)模式,。而 TPU v3則在 v2的基礎(chǔ)上提高了 30%的主頻, 30%的HBM帶寬,,100%的 HBM 容量,。另外還有 Cerebras公司的單硅片AI 芯片, 整個(gè)芯片就是一塊12寸硅片,,也是當(dāng)前最大的芯片記錄。而最后一篇演講則是 LightMatter 公司的光處理 AI 芯片,,這顆芯片看到傳統(tǒng)硅工藝的限制而獨(dú)辟蹊徑用片上光處理來(lái)做 AI 運(yùn)算,。光運(yùn)算展示了在延遲和處理容量上的巨大優(yōu)勢(shì),雖然目前應(yīng)用還有不少限制,,但也不妨是AI 芯片的另一個(gè)出路,。值得一提的是在兩個(gè)ML專(zhuān)題中,業(yè)界傳奇人物伯克利大學(xué)教授 David Patterson 在 Slack 頻道里非?;钴S,,對(duì)演講人提出了不少很詳細(xì)的問(wèn)題。這也說(shuō)明了學(xué)術(shù)界對(duì)AI/ML方向的特別關(guān)注,。
GPU
疫情推高了一大批游戲公司的股價(jià),,而電子游戲在現(xiàn)代人的眼光里也漸漸改變。大家對(duì)電子游戲的看法也越來(lái)越正面,,年輕一代對(duì)游戲設(shè)計(jì)的熱情也是越來(lái)越高,。可以預(yù)計(jì)在不遠(yuǎn)的將來(lái),,游戲?qū)⑹侨祟?lèi)生活的重要部分,。這次會(huì)議的GPU部分有三大巨頭露面,分別是Intel, Nvidia和微軟Xbox,。這里重點(diǎn)提一下Xbox的最新一代GPU. 這個(gè)GPU繼承了上一代的架構(gòu),,里面嵌入8塊AMD設(shè)計(jì)的 Zen2 CPU Core 3.8GHz。而GPU本身運(yùn)行在1.825GHz, 處理能力達(dá) 12TFLOPS FP32, 并帶有 3328個(gè)流處理器,。而DRAM則采用了16GB 的 GDDR6. 有意思的是這個(gè)芯片的內(nèi)部版圖和上一代非常類(lèi)似,,而芯片面積也是差不多。
Xbox GPU架構(gòu)
Scalable, Software, System
Hotchips雖然是芯片設(shè)計(jì)領(lǐng)域的會(huì)議,,但是大部分演講并不是簡(jiǎn)單地停留在芯片上,,而花了不少篇幅講到軟件和系統(tǒng)級(jí)的集成,。一位演講者說(shuō),芯片離開(kāi)了軟件和系統(tǒng)就什么都做不了,。以芯片為核心的一套高效的軟硬件結(jié)合系統(tǒng)才是可以商業(yè)推廣應(yīng)用的優(yōu)秀系統(tǒng),。會(huì)議里也多次提到可擴(kuò)展式的設(shè)計(jì),也是分別體現(xiàn)在系統(tǒng)的各個(gè)層面上: 芯片架構(gòu)內(nèi)部比如可以放置1, 2, 4個(gè)處理單元,,并用高效的片上網(wǎng)絡(luò)把這些單元鏈接起來(lái),; 在封裝層面也是可以把好幾個(gè)芯片和 HBM/DDR 封裝在一起;在系統(tǒng)集成上更是可以用高帶寬的網(wǎng)絡(luò)把大量芯片集結(jié)在一起組成一個(gè)巨大的處理網(wǎng)格,。
中國(guó)元素
華人在世界半導(dǎo)體行業(yè)一直占著重要地位,,近幾年隨著國(guó)內(nèi)半導(dǎo)體產(chǎn)業(yè)的強(qiáng)勁發(fā)展,本土的芯片公司也開(kāi)始發(fā)力,,頻頻在頂級(jí)芯片會(huì)議上露面,。這次的會(huì)議阿里巴巴交出了三張完美的答卷:玄鐵-910 RISC-V core, 含光800 NPU和Bare Metal云端服務(wù)器的X-Dragon架構(gòu)。而百度也展現(xiàn)了昆侖 AI 處理器系統(tǒng),。值得一提的是華人電子工程教授謝源教授也是整個(gè)會(huì)議的主委之一,,同時(shí)也是其中一個(gè)板塊的主持人。各個(gè)華人的面孔也見(jiàn)證了中國(guó)半導(dǎo)體特別在高性能芯片設(shè)計(jì)領(lǐng)域占有一席之地,,期望即將迎來(lái)騰飛的局面,。
結(jié)語(yǔ)
雖然Hotchips的主題只覆蓋芯片領(lǐng)域的一小部分,但是總體上每一個(gè)演講里的芯片都是在該領(lǐng)域內(nèi)最好的產(chǎn)品并體現(xiàn)了世界一流的設(shè)計(jì)水平,。兩天的大會(huì)下來(lái),,各個(gè)精彩的演講真是讓所有參與者大飽眼福。這次的會(huì)議只租了一個(gè)工作室做直播間,,各個(gè)報(bào)告是用視頻發(fā)放到與會(huì)者,,同時(shí)大會(huì)設(shè)立Slack頻道讓與會(huì)者和演講者互動(dòng),主持人會(huì)把大家在Slack里面的問(wèn)題挑出來(lái)讓演講者回應(yīng),。這次的網(wǎng)絡(luò)會(huì)議也是給出了一個(gè)很好的在線研討會(huì)的模式,。雖然偶爾有一點(diǎn)網(wǎng)絡(luò)連接異常導(dǎo)致的短暫中斷,但總體上不管是演講還是交流互動(dòng)都是非常高效的,。筆者參加會(huì)議下來(lái)也是收獲頗豐,。如果讀者對(duì)這次Hotchips會(huì)議的某一個(gè)具體主題感興趣,也可聯(lián)系筆者做更詳細(xì)的介紹,。
半導(dǎo)體行業(yè)觀察收集了Hotchips 2020年的部分演講slide,,您可以把本篇文章轉(zhuǎn)載到朋友圈,并回復(fù)“hotchips PPT”到半導(dǎo)體行業(yè)觀察公眾號(hào)后臺(tái),,獲取下載鏈接,。