4 月 16 日,,北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,,BAAI,2018 年 11 月 14 日成立)在北京會議中心召開了「智源學者計劃暨聯(lián)合實驗室發(fā)布會」,。
北京智源人工智能研究院(簡稱「智源研究院」)是在科技部和北京市委市政府的指導和支持下,,由北京市科委和海淀區(qū)政府推動成立,依托北京大學,、清華大學、中國科學院,、百度,、小米、字節(jié)跳動,、美團點評,、曠視 MEGVII 等北京人工智能領(lǐng)域優(yōu)勢單位共建的新型研發(fā)機構(gòu)。
引進培育高端人才,、共建聯(lián)合實驗室,、建設(shè)人工智能社區(qū)、加強產(chǎn)學研合作,是智源研究院的主要四項任務,。
智源研究院聯(lián)合曠視,,
成立智能模型設(shè)計與圖像感知聯(lián)合實驗室
智源聯(lián)合實驗室分為兩類,分別是與高校院所共建,、與優(yōu)勢企業(yè)共建,。在聯(lián)合實驗室的建設(shè)上,智源研究院遵循「成熟一個,、啟動一個」的原則,,擇優(yōu)支持共建,最多可連續(xù)支持三年,。
「北京智源-曠視智能模型設(shè)計與圖像感知聯(lián)合實驗室」已通過立項論證,,成為北京智源聯(lián)合實驗室首個成功落地的項目,擬由曠視首席科學家,、曠視研究院院長孫劍任實驗室主任,,資深研究員周舒暢任實驗室副主任。
曠視首席科學家,、曠視研究院院長孫劍
孫劍表示,,成立這個實驗室,既有國家戰(zhàn)略層面的考慮,,也是為了解決行業(yè)痛點,。
2017 年 7 月,國務院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,,人工智能上升為國家戰(zhàn)略,。建立開源開放的人工智能開放創(chuàng)新平臺,服務企業(yè)應用技術(shù)開發(fā)成為當前該領(lǐng)域的難點,。
國家也希望龍頭企業(yè),,通過打造人工智能開源開放創(chuàng)新平臺,調(diào)動產(chǎn)學研,,社會各類創(chuàng)新創(chuàng)業(yè)主體參與共同打造我國自主知識產(chǎn)權(quán)的產(chǎn)業(yè)生態(tài),,提升國際影響力,促進行業(yè)整體發(fā)展,。
而北京市是第一個國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū),,因此希望充分調(diào)動北京技術(shù)、人才方面優(yōu)勢,,通過組織機制創(chuàng)新,,通過創(chuàng)新舉措,依托龍頭行業(yè)牽引進行多主體協(xié)同創(chuàng)新,,打造我國乃至全球技術(shù)高地,。
現(xiàn)在確實有大量的高校,、研究院所、創(chuàng)新創(chuàng)業(yè)人員和行業(yè)客戶,,想?yún)⑴c到人工智能創(chuàng)新中,,但苦于沒有數(shù)據(jù),算力或算法等資源,,無法施展,。
因此,曠視與智源研究院通過聯(lián)手打造數(shù)據(jù)集和建設(shè)聯(lián)合實驗室,,推動整個行業(yè)協(xié)同創(chuàng)新發(fā)展,,建設(shè)共性技術(shù)開放創(chuàng)新平臺,構(gòu)建自主可控產(chǎn)業(yè)生態(tài),,突破人工智能重大核心共性關(guān)鍵技術(shù),,推動行業(yè)全面演進。
全球最大的物體檢測數(shù)據(jù)集 Objects365 發(fā)布
會上,,曠視研究院聯(lián)合北京智源人工智能研究院發(fā)布了全球最大的物體監(jiān)測數(shù)據(jù)集 Objects365,。
Objects365 樣例
「我們的目的是打造世界上最大規(guī)模的通用物體數(shù)據(jù)檢測集,做到規(guī)模大,、質(zhì)量高,、泛化能力強?!?/p>
孫劍介紹,,「我們第一批定義在生活中最常見的 365 個類別,比如,,室內(nèi)常見的椅子,、桌子、茶杯,、瓶子都包含在這個類別中,。第一階段,我們已經(jīng)標注了超過 60 萬張這樣的圖片,,其中這些標注框已經(jīng)超過了 1000 萬,。」
這個數(shù)據(jù)集有多大,?孫劍將微軟 2014 年創(chuàng)建的大規(guī)模圖像物體檢測數(shù)據(jù)集 COCO 作為參照物,,將二者進行了對比,「COCO 是目前最大的,、全標注數(shù)據(jù)集,訓練數(shù)據(jù)大概 12 萬,,總共數(shù)據(jù)大概不超過 20 萬,,其中還有很多數(shù)據(jù)沒有標,。我們(Objects365)第一期開放(的)圖片數(shù)是 COCO 的 5 倍,標注框超過 COCO 的 11 倍,?!?/p>
「我們的目標是,三年內(nèi),,這個數(shù)據(jù)集達到 200 萬張圖片,,2400 萬個標注框?!箤O劍說,。
算法優(yōu)化的上限嚴重依賴于基準數(shù)據(jù)集術(shù)的質(zhì)量。為保證標注質(zhì)量,,在打造 Objects365 時,,曠視設(shè)計出一套科學而嚴格的標注流程,每一張圖片的背后至少會經(jīng)過 9 名標注工人之手,。
此外,,作為一個優(yōu)秀的預訓練數(shù)據(jù)集,Objects365 預訓練模型在使用過程中,,可以輕松超越現(xiàn)有算法的精度,,顯著加速收斂過程,表現(xiàn)出極強的泛化能力,。在執(zhí)行 COCO,、VOO Det、CityPersons 等檢測任務時,,在 VOC Seg 和 ADE 等分割任務上均有顯著提升,。
如何共建聯(lián)合實驗室?
「一個平臺,、四個突破點」
「北京智源-曠視智能模型設(shè)計與圖像感知聯(lián)合實驗室 將圍繞『一個平臺,、四個突破點』進行建設(shè)?!箤O劍介紹道,。
「一個平臺」是指,建設(shè)一體化的數(shù)據(jù)共享,、模型設(shè)計和場景測試的開放創(chuàng)新平臺,。
「四個突破點」是指,在數(shù)據(jù)方向,、模型方向,、真實數(shù)據(jù)測試方向和模型部署方向做技術(shù)突破,推進大數(shù)據(jù)背景下模型架構(gòu)設(shè)計,、優(yōu)化和部署等方面的研究,。
「深度學習成不成功,,很大程度上取決于數(shù)據(jù),很多靠算法帶來的提升遠低于一個高質(zhì)量的數(shù)據(jù)(集)所能帶來的提升,?!箤O劍說。
除了最新發(fā)布的 Objects365,,曠視此前還發(fā)布了大規(guī)模擁擠場景人體檢測數(shù)據(jù)集 CrowdHuman 及一些數(shù)據(jù)標注工具,。
實驗室將立足曠視算法落地場景豐富、數(shù)據(jù)積累深厚的優(yōu)勢,,以開源數(shù)據(jù)集,、預抽取特征等形式,持續(xù)開放通用物體分類,、物體檢測追蹤,、人像人形識別屬性等視覺問題數(shù)據(jù),助力相關(guān)領(lǐng)域研究,。
針對高搜索效率,、高準確率、高靈活性等關(guān)鍵指標,,該實驗室還將開展支持大計算量模型的新神經(jīng)網(wǎng)絡架構(gòu)搜索算法(NAS)研究,,構(gòu)建一站式深度模型自動化設(shè)計平臺等工作。
該平臺包括面向特定問題的自動化深度模型設(shè)計工具,、自動化數(shù)據(jù)篩選/數(shù)據(jù)增強工具,、自動化深度學習模型優(yōu)化工具,從而在 Object365 上實現(xiàn)自動訓練比純?nèi)斯ふ{(diào)優(yōu)精度超過至少一個百分點,,消耗卡時不超過三倍的目標,。
實驗室還將開放眾多預訓練模型,包括 ResNet,、ShuffleNet 這樣的基礎(chǔ)模型以及 Faster RCNN,、Mask RCNN、SSD 檢測模型,。
近年來,,模型架構(gòu)搜索(NAS)成為了 AI 領(lǐng)域的熱門研究方向。
不久前,,曠視首次披露了 NAS 新成果:單路徑 One-Shot 模型,。這是一個簡單靈活的通用模型搜索框架,支持構(gòu)建塊(building block),、通道(channel)和混合精度(mixed-precision)多搜索空間聯(lián)合搜索,;支持任意直接度量方法做硬約束(hard constraint),從而滿足實際業(yè)務要求,。據(jù)介紹,,同等情況下,,單路徑 One-Shot NAS 的搜索精度和速度均超過目前公開的 FBNet、ProxylessNAS 等 SOTA 框架,。
「很多時候,我們把一個技術(shù)(算法)落地,,真的是不是能在實際數(shù)據(jù)中做得很好,,其實不知道的。實際數(shù)據(jù)中有一些是非公開數(shù)據(jù),,不能到真正的場景中去測,;另外一些數(shù)據(jù)涉及到隱私,需要脫敏,?!箤O劍說,聯(lián)合實驗室的計劃是,,提供一個實戰(zhàn)場景開發(fā)和測試環(huán)境,,大家上交模型,在這個環(huán)境中進行測試,。
聯(lián)合實驗室將建設(shè)人臉抓拍識別,、結(jié)構(gòu)化檢測、大規(guī)模人像比對等驗證場景,,提供自動分析報告服務,,為研究算法調(diào)優(yōu)提供環(huán)境。他們還將積極探索低位寬等網(wǎng)絡壓縮技術(shù),,研發(fā)高效硬件部署方案,,推動模型研究成果迅速投入實用。
針對計算機視覺算法與真實場景適配的問題,,實驗室還將建設(shè)可重現(xiàn)的實景測試環(huán)境,,并提供自動化的量化錯誤分析報告,幫助算法迭代,。
「通過以上措施,,實驗室將被打造成為一個開放、貼近實際場景的計算機視覺算法研究實驗平臺,,形成涵蓋數(shù)據(jù),、平臺、場景的完整閉環(huán),,有利于打造我國自主可控的技術(shù)和產(chǎn)業(yè)生態(tài),,共同助力我國圖像感知和計算領(lǐng)域的技術(shù)及應用達到國際先進水平?!箤O劍表示,,實驗室平臺建成后,,將面向高校院所、創(chuàng)業(yè)企業(yè)等創(chuàng)新創(chuàng)業(yè)主體開放,,致力推動圖像感知與計算領(lǐng)域的協(xié)同創(chuàng)新,。
DIW2019 挑戰(zhàn)賽啟動,
3 個賽道冠軍將各獲 1 萬美金獎勵
「我們的目標是建設(shè)開源社區(qū),、打造產(chǎn)業(yè)生態(tài),。」孫劍說,。
除了開放預訓練模型,,開源數(shù)據(jù)標注、模型分析,、模型自動調(diào)優(yōu)等全套相關(guān)工具,,他們還將提供實驗例程、開源完整的訓練代碼庫,,支持高校本科及研究生教學,,每年培訓學生人數(shù)不少于 500 人;每年還會組織圍繞平臺的國際比賽,。
今年,,曠視聯(lián)合智源研究院舉辦 Detection In the Wild 2019(DIW 2019)挑戰(zhàn)賽。
孫劍介紹,,DIW 2019 挑戰(zhàn)賽是基于 2019 年 CVPR 的 workshop(研討會),,為了推動目標檢測技術(shù)的發(fā)展而設(shè)計的,可以改善現(xiàn)有目標檢測數(shù)據(jù)集的類別覆蓋不全,,標注精度不高,,密集場景缺少等問題。
DIW 2019 挑戰(zhàn)賽共有三個賽道:
Objects365 賽道:選手利用公開的 365 種類別,,60 萬張圖片超過 1000 萬個框的完整訓練集對檢測模型進行訓練,;在 3 萬張圖片構(gòu)成的驗證集上調(diào)試算法,并在 10 萬張圖片構(gòu)成的測試集上進行最終挑戰(zhàn),。
Objects365 小賽道:從 Objects365 數(shù)據(jù)集中挑選出 65 個類別,,選手可以用 1 萬張圖片進行模型訓練。
CrowdHuman 賽道:為了解決現(xiàn)實生活中的遮擋問題,,其算法的提升將會推動人體檢測算法落地,。屆時,選手將基于專門為了密集場景人體檢測設(shè)計的 CrowdHuman 數(shù)據(jù)集進行訓練,,數(shù)據(jù)集包含有豐富標注信息和多種場景,。
挑戰(zhàn)賽已于發(fā)布會當天啟動;5 月 10 日,將開放測試集,;6 月 12 日,,結(jié)果提交截止;最終結(jié)果將在 6 月 17 日(美國當?shù)貢r間)公布,。每個賽道的冠軍將獲得 1 萬美金獎勵,,優(yōu)勝隊伍將被邀請至 CVPR 的研討會上做經(jīng)驗分享。
「智源學者計劃」啟動,,
每人每年至少可獲 50 萬支持
發(fā)布會當天,,智源研究院還啟動了「智源學者計劃」。
「『智源學者計劃』的目標,,就是要找到最好的人,給他自由支配的經(jīng)費,,提供他需要的資源,,支持開展人工智能領(lǐng)域特定方向上的重大基礎(chǔ)問題研究,或者開展前沿問題的自由探索,?!裹S鐵軍院長說。
「智源學者計劃」將依托北京大學,、清華大學,、中科院等優(yōu)勢高校院所,以及曠視等骨干企業(yè)研究院,,對智源科學家首席(CS),、智源研究項目經(jīng)理(PM)、智源研究員(PI)和智源青年科學家(38 歲以下)四類人才進行重點支持,。
經(jīng)過提名,、初評、審議等流程,,已經(jīng)遴選出首批智源學者候選人,,共 21 人,并即將啟動公示程序,。
據(jù)悉,,首批青年科學家推選工作開展以來,清華,、北京各單位專家共計推選了 54 名候選人,,參加答辯 42 人,經(jīng)專家評審,,最終選出了 9 名,。年級最輕的一位僅 28 歲,是曠視研究院模型研究組負責人張祥雨博士。
在官網(wǎng)上進行一個月公示后,,若無意外,,智源研究院將與他們簽訂聘任協(xié)議。
屆時,,智源研究院將直接向他們支付費用,,不用走單位的人事體制。黃院長說,,「我們看重他是一個有潛力的人,,我們就直接給他,大概就是不低于 50 萬的每年的支持力度(每個人),?!?/p>
這些智源學者不需要在智源研究院辦公,還在原單位繼續(xù)從事學術(shù)研究, 成果也全部屬于其所在單位,,「研究院不擁有也不期望去獲得任何知識產(chǎn)權(quán)」,,「因為他做的是人工智能,是符合國家的戰(zhàn)略方向,,是符合北京市的方向,,所以我們給他支持?!裹S院長說,。
此外,這些智源學者在科研工作中所需要的經(jīng)費,,也會獲得研究院支持,。黃院長表示,只要不用到違規(guī),,怎么用,,完全由自己決定。
黃院長還表示,,智源學者的申報不是每年只有一次,,而是不分批次,只要是符合要求的人才,,通過申報程序,,可以隨時進入研究院支持的范圍。
今年,,智源研究院將計劃遴選智源學者 100 人,,大概覆蓋 5 到 7 個重大方向,其中,,青年科學家 30-50 人,。2020 年和 2021 年再分別增加 100 人,,智源學者總體規(guī)模保持在 300 人左右。