3月15日,據(jù)路透社報(bào)道,,百度昆侖芯片業(yè)務(wù)完成獨(dú)立融資,,投后估值約130億元人民幣,領(lǐng)投方為CPE,,跟投方IDG,、君聯(lián)資本、元禾璞華,。據(jù)了解,,百度正在考慮將其人工智能芯片設(shè)計(jì)能力進(jìn)行商業(yè)化,目的是將昆侖部門打造成一家獨(dú)立的公司,。
如今互聯(lián)網(wǎng)科技企業(yè)造芯已不是什么新鮮事,,尤其是AI領(lǐng)域已經(jīng)成為世界科技巨頭爭(zhēng)奪的制高點(diǎn), IBM,,微軟,谷歌和亞馬遜正在微調(diào)其AI平臺(tái),,以使客戶更輕松,,更快捷地整合各種AI技術(shù)。
可以說(shuō),,造芯熱幾乎與人工智能的爆發(fā)處于同一個(gè)階段,,人工智能的這一輪爆發(fā)是深度學(xué)習(xí)算法的興起,而深度學(xué)習(xí)的基礎(chǔ)就是需要更多的數(shù)據(jù)訓(xùn)練,、更高的算力支撐,。當(dāng)傳統(tǒng)芯片逐漸無(wú)法滿足互聯(lián)網(wǎng)爆發(fā)的算力需求時(shí),擁有先進(jìn)算法和強(qiáng)大計(jì)算能力的互聯(lián)網(wǎng)公司成為了芯片自研的推動(dòng)者,,國(guó)內(nèi)外企業(yè)幾乎步調(diào)一致地各自開(kāi)啟了這一篇章,。
中國(guó)在進(jìn)入其市場(chǎng)方面的行動(dòng)將在該行業(yè)的創(chuàng)新中發(fā)揮關(guān)鍵作用,。根據(jù)一項(xiàng)研究,中國(guó)現(xiàn)在占全球半導(dǎo)體消費(fèi)的60%,。根據(jù)《國(guó)際商業(yè)戰(zhàn)略》,,2019年,中國(guó)半導(dǎo)體行業(yè)銷售額為2122億美元,,北美為595億美元,,世界其他地區(qū)為488億美元,歐洲為418億美元,,日本為387億美元,。
圖:2019年按地區(qū)劃分的全球半導(dǎo)體消費(fèi)(十億)
目前,國(guó)產(chǎn)AI芯片處于一個(gè)窗口,,這個(gè)窗口有如下特征:1,、市場(chǎng)廣闊,容納下許多巨頭玩家,;2,、處于爆發(fā)期初期,大規(guī)模應(yīng)用尚未到來(lái),;3,、應(yīng)用場(chǎng)景分散、復(fù)雜度高,,需要定制化,;4、單獨(dú)芯片不夠,,需要配套的解決方案支撐,。
在這樣的大背景下,對(duì)“AI第一股”百度而言,,造芯能抓住其中的哪些機(jī)會(huì),,競(jìng)爭(zhēng)力又有多少?
問(wèn)世2年多,,昆侖幾何,?
衡量一款芯片好不好,成不成功,,最直觀的就是看出貨量,。百度昆侖于2018年宣布,2019年12月,,百度和三星宣布,,百度首款基于云的產(chǎn)品昆侖第一代用于計(jì)算和邊緣計(jì)算的AI芯片已經(jīng)完成。
截至目前,實(shí)現(xiàn)量產(chǎn)的百度昆侖1已在百度搜索引擎及云計(jì)算用戶部署2萬(wàn)片,。與國(guó)內(nèi)其他互聯(lián)網(wǎng)造芯玩家的產(chǎn)品相比,,百度昆侖1的出貨量可以說(shuō)是不錯(cuò)的。
從技術(shù)結(jié)合場(chǎng)景的經(jīng)驗(yàn)來(lái)看,,新一批崛起的AI 芯片要針對(duì)不同的人工智能應(yīng)用類型和場(chǎng)景,,對(duì)于芯片的要求就不單單是要適合深度學(xué)習(xí),需要兼顧計(jì)算能力,、能耗和靈活性,。
云計(jì)算巨頭紛紛布局云計(jì)算+FPGA芯片,首先因?yàn)镕PGA作為一種可編程芯片,,非常適合部署于提供虛擬化服務(wù)的云計(jì)算平臺(tái)之中,。FPGA的靈活性,可賦予云服務(wù)商根據(jù)市場(chǎng)需求調(diào)整FPGA加速服務(wù)供給的能力,。
運(yùn)算速度,、功耗等性能是衡量一款芯片的核心指標(biāo)。昆侖芯片定位為通用AI芯片,,目標(biāo)是提供高性能,,低成本,高度靈活的AI芯片,。特別要指出的是,,昆侖芯片既能做訓(xùn)練也能做推理,它可以滿足AI的高處理需求,,用于云實(shí)例和邊緣實(shí)例,,包括數(shù)據(jù)中心,公共云和自動(dòng)駕駛汽車,。據(jù)了解,,昆侖2將采用7nm工藝打造,將于2021年實(shí)現(xiàn)量產(chǎn),,其性能對(duì)1代,,將再提升3倍。
一份經(jīng)紀(jì)報(bào)告顯示:“這種大型的,,基于云的,,具有高計(jì)算能力的AI芯片具有很高的技術(shù)門檻。只有百度,,華為和寒武紀(jì)才能生產(chǎn)這些產(chǎn)品,?!?/p>
在昆侖芯片誕生前,,2017年百度內(nèi)部數(shù)據(jù)中心、自動(dòng)駕駛系統(tǒng)等就已大規(guī)模使用部署了超過(guò)10000片F(xiàn)PGA加速器,這對(duì)跨行業(yè)跨場(chǎng)景測(cè)試?yán)鲂酒蛳铝顺醪交A(chǔ),。隨后,,在部署上線的微億智造工業(yè)智能質(zhì)檢設(shè)備上,百度智能云以整機(jī)一體化方式,,向微億智造交付搭載百度昆侖芯片的百度云質(zhì)檢一體機(jī),。
僅僅硬件遠(yuǎn)遠(yuǎn)不夠,一個(gè)整體的解決方案對(duì)商業(yè)化落地也至關(guān)重要,。百度提出了AI-Native的云計(jì)算架構(gòu),,從基礎(chǔ)設(shè)施的AI計(jì)算集群、AI芯片,,到工程平臺(tái)的飛槳,、云原生,以及應(yīng)用開(kāi)發(fā)平臺(tái)的視頻云,、區(qū)塊鏈等,,通過(guò)云智一體、端到端的方式,,支持產(chǎn)業(yè)的智能應(yīng)用,。
當(dāng)然,無(wú)形財(cái)產(chǎn)的積累對(duì)以科技為導(dǎo)向的企業(yè)來(lái)說(shuō)也是至關(guān)重要的一環(huán),,手機(jī)芯片玩家高通光靠專利費(fèi)就吃透了全世界,。在AI專利申請(qǐng)和許可方面,百度已連續(xù)三年位居中國(guó)第一,,百度AI開(kāi)放平臺(tái)也已經(jīng)匯集了265萬(wàn)開(kāi)發(fā)者,。
百度在其他地區(qū)的市場(chǎng)份額不大,與成熟的競(jìng)爭(zhēng)對(duì)手競(jìng)爭(zhēng)也將非常艱難,。但盡管如此,,在當(dāng)前大環(huán)境下,昆侖芯片如今的量產(chǎn)和交付進(jìn)展卻凸顯了AI在中國(guó)的整體發(fā)展勢(shì)頭,,也代表了中國(guó)企業(yè)在這一新興領(lǐng)域確立全球領(lǐng)導(dǎo)者的決心,。
其實(shí)在AI領(lǐng)域,中國(guó)一直沒(méi)有落后,。據(jù)斯坦福大學(xué)發(fā)布的一份222頁(yè)的《2021年度AI指數(shù)報(bào)告》指出,,2020年,中國(guó)在世界人工智能期刊上的引用頻次首次超過(guò)美國(guó),。在刊登數(shù)量上,,早在2004年,中國(guó)在人工智能期刊的總發(fā)表數(shù)量上短暫超過(guò)美國(guó),,然后在2017年重新占據(jù)領(lǐng)先地位,。
中國(guó)在世界人工智能期刊上的引用頻次首次超過(guò)美國(guó)
定制、魔改、二次開(kāi)發(fā)
早在2011年百度啟動(dòng)了FPGA AI加速器項(xiàng)目,,2015年的FPGA部署已經(jīng)超過(guò)5000片,,2017年成為業(yè)界部署最多的,超過(guò)了12000片,;2018年百度發(fā)布自主研發(fā)的AI芯片——百度昆侖,;2019年流片成功,2020年昆侖一代開(kāi)始量產(chǎn)并且大規(guī)模部署,。
關(guān)于昆侖芯片的細(xì)節(jié)我們不做過(guò)多的贅述,,但是值得一提的是,往往GPU是打造AI芯片的重要手段之一,,但是我們也可以看出,,百度從一開(kāi)始卻是基于FPGA打造的,F(xiàn)PGA的特點(diǎn)就是可編程,,這樣使用昆侖芯片的用戶,,就完全可以根據(jù)自己的應(yīng)用場(chǎng)景來(lái)進(jìn)行定制、魔改,、二次開(kāi)發(fā),。
由于AI應(yīng)用場(chǎng)景的分散和復(fù)雜度高,定制化就顯得格外重要,。FPGA作為一種可編程芯片,,非常適合部署于提供虛擬化服務(wù)的云計(jì)算平臺(tái)之中。昆侖芯片配以FPGA的靈活性,,可讓用戶可以按照自己的需求和應(yīng)用場(chǎng)景進(jìn)行專項(xiàng)定制,,魔改,二次開(kāi)發(fā),,實(shí)現(xiàn)更快速的市場(chǎng)普及,,并能完成自身產(chǎn)品的后續(xù)迭代。
在性能方面,,百度昆侖性能最高比英偉達(dá)T4強(qiáng)三倍,。放大到全球的AI芯片,據(jù)麻省理工學(xué)院林肯實(shí)驗(yàn)室超級(jí)計(jì)算中心的一項(xiàng)統(tǒng)計(jì)研究《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測(cè)試》,,在全球公開(kāi)宣布的人工智能加速器和處理器的性能與功率分散圖中,,我們也可以看出,昆侖芯片性能也處于高位(如下圖),。下圖顯示了最近公開(kāi)發(fā)布的一些AI處理器能力(截至2019年5月),,列出了芯片的峰值性能與功耗。
公開(kāi)宣布的人工智能加速器和處理器的性能與功率分散圖(圖源:MIT《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測(cè)試》研究)
注:其中x軸表示峰值功率,,y軸表示每秒千兆次操作的峰值,。處理能力的計(jì)算精度由所采用的幾何形狀來(lái)描述,;計(jì)算精度范圍從單個(gè)位int1到單個(gè)字節(jié)int8,從4字節(jié)float 32到8字節(jié)float 64,。形狀因子由顏色來(lái)描述,這對(duì)于顯示消耗了多少能量很重要,,而且對(duì)于顯示在單個(gè)芯片,、單個(gè)PCI卡和整個(gè)系統(tǒng)中可以裝載多少計(jì)算量也很重要。藍(lán)色僅是單個(gè)芯片的性能和功耗,。橙色表示芯片的性能和功率(注意,,它們都在200-300W區(qū)域)。綠色表示整個(gè)系統(tǒng)的性能和能力——在這里是單節(jié)點(diǎn)桌面和服務(wù)器系統(tǒng),。
眾所周知,,“AI應(yīng)用場(chǎng)景碎片化、落地難”已成行業(yè)共識(shí),,在AI芯片前仆后繼的大軍中,,泡沫過(guò)后,許多企業(yè)已銷聲匿跡,,僅留下了為數(shù)不多的十幾家,。百度又能靠什么?
造芯者不但需要懂硬件,,還需要懂AI算法軟件,。據(jù)了解,百度昆侖作為百度人工智能平臺(tái)的核心組件,,可以原生支持開(kāi)源深度學(xué)習(xí)框架飛槳(PaddlePaddle),,百度機(jī)器學(xué)習(xí)平臺(tái)(BML)及各垂類的AI 能力引擎。另外,,昆侖不僅支持全球主流CPU,、操作系統(tǒng),Pytorch和 TensorFlow 等深度學(xué)習(xí)框架,,也和國(guó)產(chǎn)化廠商密切合作支持飛騰,、申威和海光等國(guó)產(chǎn)CPU,麒麟,、深度和統(tǒng)信等國(guó)產(chǎn)操作系統(tǒng),。
此外,生態(tài)能力在芯片行業(yè)中尤為關(guān)鍵,,而且放在自家產(chǎn)品上可盡顯其性價(jià)比優(yōu)勢(shì),。
其實(shí)這點(diǎn)我們可以從華為麒麟芯片得到啟發(fā),因?yàn)橛惺謾C(jī)終端的不斷試錯(cuò)和支持,,麒麟芯片才能在迭代中不斷創(chuàng)新,,二者相輔相成,,最終成就一段手機(jī)史上的佳話。百度亦是如此,,相比其他單打獨(dú)斗的AI芯片企業(yè),,它有大公司的生態(tài)優(yōu)勢(shì)。百度完全不用有一般AI芯片廠商的擔(dān)憂:“我該做什么樣的芯片,?芯片做出來(lái)能否迎合市場(chǎng)的需求,?又將用在什么場(chǎng)景?”因?yàn)榘俣扔刑嗟膽?yīng)用場(chǎng)景了,,智能音箱,、智能駕駛Apollo、智能云等等,,這些對(duì)百度整體業(yè)務(wù)都形成一個(gè)大循環(huán),。
特斯拉也是一樣。在特斯拉自研FSD芯片前,,需要采用英偉達(dá)的芯片,,不僅在性能上滿足不了特斯拉的需求,而且成本還高昂,,完全不具有話語(yǔ)權(quán),。此后,特斯拉自己研發(fā)芯片竟達(dá)到了與英偉達(dá)相同乃至更好的效果,,成本也把控在自己手里,。
在造芯策略上,百度與當(dāng)下國(guó)際互聯(lián)網(wǎng)巨頭如亞馬遜,、谷歌,、微軟等如出一轍,自產(chǎn)自用為主,,但同時(shí)也注意為芯片建生態(tài),,芯片又反哺生態(tài)。未來(lái)隨著智能汽車逐漸爆發(fā),,云計(jì)算,、物聯(lián)網(wǎng)市場(chǎng)的大幅度需求,百度或?qū)⒈煌粕蠚v史的潮頭,。