昨天,阿里巴巴發(fā)布了第一款AI芯片——含光800,。除了參數(shù)外,,還有怎樣的故事和深層次考慮?最近一兩年,,只要國內有公司發(fā)布AI芯片,,就會在各大社交圈、媒體中炸開鍋。日子過不了多久,,就會淡去,,留下三三兩兩歷史記錄中的文章。但我們很少知道背后的故事,,這并不是幾日的技術狂歡所能說清的,。昨天,阿里巴巴發(fā)布了第一款AI芯片——含光800,。合著云棲大會的熱鬧,,該芯片瞬間成為了近日最閃耀的頭條新聞。當阿里CTO張建鋒在會議廳展示這塊芯片時,,介紹很簡短,,除了參數(shù)外,并沒有介紹背后的故事,。
“前幾天,,我們都還不知道能不能完成。只能每周干7天,,每晚干到12點,。就在15號凌晨時,我們最后一批人早上5點20離開(實驗室),,終于調出來了,。當時很多人說不可能,但我們做到了,?!?阿里巴巴達摩院平頭哥AI芯片研究員焦陽(驕旸)在接受TechSugar等媒體采訪時,說到了這款芯片背后的故事,。
故事的開頭夾雜的質疑,,故事的結尾如這批研究員所愿。
這顆芯片
7個月完成了前端設計,,之后用3個月就成功流片,,速度的確驚人。
據(jù)現(xiàn)場介紹,,在業(yè)界標準的ResNet-50測試中,,含光800推理性能達到78563 IPS,比目前業(yè)界最好的AI芯片性能高4倍,;能效比500 IPS/W,,是第二名的3.3倍。在杭州城市大腦的業(yè)務測試中,,1顆含光800的算力相當于10顆GPU,。
人工智能芯片分論壇中,,焦陽介紹了更多該芯片的細節(jié),如下兩張圖,。
含光800采用四核設計,,其包含170億顆晶體管,采用臺積電的12nm工藝,。之所以采用四核架構,,焦陽表示:“在設計之后,由于良率提升需求,,四個Core任何有一個Core壞死,,都不影響芯片工作,這是我們在架構設計時做的特別處理,?!?/p>
此外,計算單元盡量被放在了存儲邊上,,這是功耗做的很低的原因。
含光800性能的突破得益于軟硬件的協(xié)同創(chuàng)新:硬件層面采用自研芯片架構,,通過推理加速等技術有效解決芯片性能瓶頸問題,;軟件層面集成了達摩院算法,針對CNN及視覺類算法深度優(yōu)化計算,、存儲密度,,可實現(xiàn)大網(wǎng)絡模型在一顆NPU上完成計算。
含光800已開始應用在阿里巴巴內部核心業(yè)務中,。根據(jù)云棲大會的現(xiàn)場演示,,在城市大腦中實時處理杭州主城區(qū)交通視頻,需要40顆傳統(tǒng)GPU,,延時為300ms,,使用含光800僅需4顆,延時降至150ms,。拍立淘商品庫每天新增10億商品圖片,,使用傳統(tǒng)GPU算力識別需要1小時,使用含光800后可縮減至5分鐘,。
含光800將通過阿里云對外輸出AI算力,。基于含光800的AI云服務當天正式上線,,相比傳統(tǒng)GPU算力,,性價比提升100%。
過去半年,,平頭哥先后發(fā)布玄鐵910,、無劍SoC平臺。隨著含光800的發(fā)布,平頭哥端云一體全棧產品系列初步成型,,涵蓋處理器IP,、一站式芯片設計平臺和AI芯片,實現(xiàn)了芯片設計鏈路的全覆蓋,。
張建鋒說:“在全球芯片領域,,阿里巴巴是一個新人,玄鐵和含光800是平頭哥的萬里長征第一步,,我們還有很長的路要走,。”
到底怎么想的,?
在發(fā)布會結束后,,筆者從分論壇中,了解到了這款NPU更多的故事和背后的想法,。首先是為什么——阿里巴巴為什么要做云上大芯片,?
從焦陽的回答中,筆者總結為以下幾點:
1,,阿里巴巴云計算是一個快速增長的業(yè)務,,在業(yè)內處于領先地位。硬件設計可以幫助阿里巴巴快速拓展業(yè)務,,降低計算成本,,提供海量的計算能力。云計算走到今天,,如果沒有硬核就很難繼續(xù)往下走,,未來很難在算力上有更多的提高。
2,,這不是為了短期商業(yè)化,,而為更遠的愿景。以技術為本,,打造過硬的技術,。
3,為什么做推理而不是訓練,?雖然在AI發(fā)展中,,第一步都是要做很多的訓練,但隨著算法高速發(fā)展之后,,將迎來推理端的發(fā)展,。阿里巴巴涉及的業(yè)務,如城市大腦,、視覺分析等,,算力大大提高其計算效率,,把真正的業(yè)務量達到突破,從而在云計算中增加更多流量,,解決未來業(yè)務發(fā)展目標,。
4,阿里巴巴與傳統(tǒng)互聯(lián)網(wǎng)公司不同,,除了搜索和廣告業(yè)務,,還有更豐富的視覺類業(yè)務,如淘寶圖片,、搜索,、智能城市、智能工廠等,?;谶@些業(yè)務,CNN加速是對NPU的一個重要方向點,,此外阿里還將擴展到新的模式適配,。(如下圖)
在提到未來芯片計劃時,焦陽非常務實地說道:“第一步先把技術做深做扎實,,達摩院或者其他的技術團隊,,目前都在做很多的項目,我們需要從業(yè)務中了解業(yè)務,,不能僅限于只做業(yè)務,需要舉一反三,,來產生更有深度,,更有技術水平的產品。含光雖然已經(jīng)取得了初步的結果,,但這遠遠不夠,,我們要達到英偉達的水平還有很長的路要走,有了好技術才能有章可循,,沒有技術,,連推產品都推不動?!?/p>
“AI芯片是新的領域,,新領域本身就存在很多機會。而且人工智能算法是需要特殊架構的,,對于阿里巴巴來說,,就是挑戰(zhàn)皇冠上的明珠?!庇?0年GPU領域工作經(jīng)驗的焦陽,,談到公司未來也是充滿信心,。
阿里芯片的邊界
前不久,看到新聞上提到馬云在阿里巴巴卸任現(xiàn)場上演唱了《怒放的生命》時,,我突然發(fā)現(xiàn),,凡人已經(jīng)很難阻止阿里巴巴了。
2017年,,宣布成立達摩院,;2018年成立平頭哥;2019年便掏出了這一款AI芯片,。對2020年的大事,,目前筆者還沒嗅到什么消息,憑借阿里的想象力,,總預感會有大事發(fā)生,。
其實在芯片這塊,阿里巴巴的所涉及的部分已經(jīng)超過一般人所知,。
阿里巴巴集團副總裁周明的題為《阿里巴巴基礎設施挑戰(zhàn)與芯片策略》的演講中提到,,如今阿里在技術分布有CPU、異構計算,、NPU,、FPGA;互聯(lián)和網(wǎng)絡部分則有自研網(wǎng)絡交換機及NOS,、自研400G硅光模塊,、HAIL2.0數(shù)據(jù)中心網(wǎng)絡架構;存儲端集合了從SSD到DRAM到新型存儲截止愛到服務器的一體機,,其中包括AliFlash V3,、AliFlash V5.0、阿里巴巴自研云計算服務器,、阿里巴巴邊緣云服務器,。
因為基礎設施的加持,才有云棲大會第一場主論壇中,,阿里巴巴董事局主席兼首席執(zhí)行官張勇對數(shù)字經(jīng)濟的暢想,,他表示:“在數(shù)字經(jīng)濟時代,大數(shù)據(jù)是石油,,而算力是引擎,。算力不僅代表計算的規(guī)模和計算的效率,同時它也包括數(shù)量的要求,、智慧的程度,。算力的發(fā)展,最終一定是“數(shù)”和“智”全面結合,。只有這樣,,我們才能夠在走向數(shù)字化的同時,,真正走向未來我們共同相信會全面爆發(fā)的智慧化、數(shù)智化,?!?/p>
更多信息可以來這里獲取==>>電子技術應用-AET<<