一,、人工智能悄然興起
“人工智能”涵蓋了很多前沿技術(shù)和分支,卻很難用一句話來定義,因為它一直處在發(fā)展當(dāng)中。比如,,一些在過去看來很“人工智能”的事情,現(xiàn)在卻變成了簡單的“機械重復(fù)”,,像是數(shù)字的高速計算,、圖像的處理等。但總體上來看,,“人工智能”的本質(zhì)和目的一直沒有發(fā)生太多變化,,那就是“完成人類的部分腦力工作”。
20世紀(jì)60年代開始,,就有許多科幻電影和科幻小說描述著人類對“人工智能”的憧憬和恐懼,,比如斯皮爾伯格的知名影片《人工智能》。不過在現(xiàn)實中,,長久以來,,受到技術(shù)、科技發(fā)展和應(yīng)用層面的限制,,人工智能只是一件人人都在說,,都以為別人在做,但事實上卻沒多少人知道該怎么做的事——無論在學(xué)術(shù)研 究層面還是在應(yīng)用層面都是如此,。
人工智能曾經(jīng)在20世紀(jì)90年代互聯(lián)網(wǎng)泡沫破裂前風(fēng)靡一時,,到了21世紀(jì)伊始卻變成了一個禁忌,大家開始懷疑它是否存在,。而到了2011年,,美國資本市場再度為人工智能而瘋狂。風(fēng)險投資機構(gòu)和頂級科技公司們開始頻繁投資這個領(lǐng)域的創(chuàng)業(yè)公司,,投資范圍從應(yīng)用層面的機器人,、增強現(xiàn)實,到底層技術(shù)層面的深度學(xué)習(xí)算法,、神經(jīng)網(wǎng)絡(luò)芯片等,,人工智能項目也遍地開花。比如,Google接連投資了虛擬現(xiàn)實創(chuàng)業(yè)公司Magic Leap,,收購了人工智能公司DeepMind;Facebook收購語音識別公司W(wǎng)it.ai,,等等。
除了投資外部團隊之外,,像IBM,、Google、Facebook和百度等國內(nèi)外科技巨頭們也紛紛加強自己的人工智能方面的專業(yè)團隊,,招募了一 批人工智能尤其是深度學(xué)習(xí)相關(guān)領(lǐng)域的科學(xué)家,,如深度學(xué)習(xí)鼻祖之一Geoffrey Hinton加入了Google,Yann LeCun加入了Facebook擔(dān)任人工智能實驗室負(fù)責(zé)人,,Andrew Ng(吳恩達(dá))加入百度負(fù)責(zé)深度學(xué)習(xí)研究院等,。
二、驅(qū)動人工智能發(fā)展的內(nèi)外動因
“人工智能”的再度興起并非偶然,,外部環(huán)境和人工智能自身都在發(fā)生演化,。我們認(rèn)為,驅(qū)動人工智能領(lǐng)域發(fā)展到現(xiàn)在程度的外部動因有:
1.傳感器能力和數(shù)量的大幅提升:LIGA等微電子技術(shù)的日趨成熟,,推動著傳感器的能力有了質(zhì)的飛躍,,而大量智能設(shè)備的出現(xiàn)則進一步加速了傳感器領(lǐng)域的繁榮。這些延伸向真實世界各個領(lǐng)域的觸角是機器感知世界的基礎(chǔ),,而感知則是智能實現(xiàn)的前提之一,。
2.計算成本的大幅下降:摩爾定律使得計算成本在迅速下降,同時云計算的出現(xiàn),、GPU的大規(guī)模應(yīng)用使得集中化的數(shù)據(jù)計算能力變得前所未有得強 大,。大規(guī)模的的集中式計算使得人工智能的發(fā)展速度指數(shù)級加快。過去僅訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型對某一物體的認(rèn)知就要花費近一年時間,,而現(xiàn)在這個時間被縮短到幾 天內(nèi)。
3.海量數(shù)據(jù)的出現(xiàn):根據(jù)預(yù)計,,2015年全球產(chǎn)生的數(shù)據(jù)總量將達(dá)到十年前的20多倍,。如此海量的數(shù)據(jù)給機器學(xué)習(xí)的提供了足夠多的素材(但是需要注意的是,在其中真正有標(biāo)注的數(shù)據(jù)不超過總量的10%),。
當(dāng)然,,更重要的驅(qū)動因素是內(nèi)因——算法的進步。當(dāng)下人工智能領(lǐng)域最先進,、應(yīng)用最廣泛的核心技術(shù)是深度神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí)),。而且,直到2006年,,深度神經(jīng)網(wǎng)絡(luò)才得到快速發(fā)展,,逐漸成為人工智能領(lǐng)域的主流研究方向。
21世紀(jì)人工智能的里程碑事件之一是,2006年Geoffrey Hinton發(fā)表的論文《A fast learning algorithm for deep belief nets》,。他在此文中提出的深層神經(jīng)網(wǎng)絡(luò)逐層訓(xùn)練的高效算法,,讓當(dāng)時計算條件下的神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練成為了可能,同時通過深度神經(jīng)網(wǎng)絡(luò)模型得到的優(yōu)異的實 驗結(jié)果讓人們開始重新關(guān)注人工智能,。之后,,深度神經(jīng)網(wǎng)絡(luò)模型成為了人工智能領(lǐng)域的重要前沿陣地,深度學(xué)習(xí)算法模型也經(jīng)歷了一個快速迭代的周期,,Deep Belief Network,、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各種新的算法模型被不斷提出,,而其中卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,,CNN)更是成為圖像識別最炙手可熱的算法模型。
目前,,隨著GPU和CPU集群的出現(xiàn),,云端的計算資源已經(jīng)慢慢不再是人工智能的發(fā)展瓶頸。而人工智能算法模型的進一步豐富和改進以及本地化人工智能的實現(xiàn)成為了人工智能新的主要發(fā)展方向,。
三,、人工智能的三步走
從人工智能的整個發(fā)展歷程來看,按照應(yīng)用場景和人工智能資源的集中度,,可以大致分成三個階段,。
第一階段:實驗室研究階段,這一階段的人工智能資源高度集中,。人工智能在2011年前的發(fā)展大致還處于實證研究階段,,資源高度集中在國家或大學(xué) 資助的研究機構(gòu)中,用于算法模型的訓(xùn)練和研究,,人工智能還只能為極少數(shù)人接觸到,。這一階段大量的工作除了在算法模型本身的研究外,還包括建立計算能力本 身,。
第二階段:企業(yè)應(yīng)用階段,,這一階段的人工智能資源被少部分科技巨頭掌握。在人工智能表現(xiàn)出一定的實際應(yīng)用價值后,,科技巨頭們一擁而上,,紛紛希望 在這個領(lǐng)域取得突破。在少部分核心企業(yè)掌握了大規(guī)模的人工智能資源以后,,其它小規(guī)模的企業(yè)一般會利用這些核心企業(yè)提供的人工智能資源接口和其支持的人工智 能應(yīng)用為自身的發(fā)展提供服務(wù),。由于掌握大規(guī)模的計算資源是這一模式的前提,因此這一階段人工智能資源的集中度仍然非常高,,而這將是人工智能在企業(yè)場景下的 主要應(yīng)用形式,,即集中計算,分布使用。
第三步:個人應(yīng)用階段,,這一階段的人工智能資源被分散到個人手中,。顯然,依賴于云端大規(guī)模計算資源的人工智能算法限制著人工智能在消費者場景的 應(yīng)用,,因為集中式計算意味著巨量的網(wǎng)絡(luò)資源消耗,,并且因為網(wǎng)絡(luò)問題,難以在消費者應(yīng)用場景中有穩(wěn)定的表現(xiàn),。因此,,人工智能的本地化,也就是從集中走向分布 (細(xì)化到智能手機,、可穿戴設(shè)備等)實現(xiàn)將是人工智能在消費者場景中得到普及的關(guān)鍵一步,。伴隨著人工智能的本地化實現(xiàn),將使得人工智能真正延展到手持設(shè)備,、 家用電器,、汽車等消費級應(yīng)用。
人工智能本地化實現(xiàn)的難點在于本地的計算能力在如今動輒幾個G的算法模型面前杯水車薪,、無能為力,。一部iPhone 6手機采用一般的CNN算法去處理一張200*200像素圖像的ImageNet千分類問題需要的時間是300毫秒,但這樣的處理速度對于用戶體驗來說是 災(zāi)難性的,。要提高本地的圖像識別處理速度,,目前能夠想到的途徑有三條:一是精簡算法模型,根據(jù)實際的場景適配需要的精度,,讓模型盡可能簡化,,二是提升 CPU的計算能力。目前的智能手機CPU已經(jīng)在20nm制程以下,,按照傳統(tǒng)路線,,CPU提升的極限可能在7-10nm,這其實非常有限,。而且,,大功耗也是 一般移動設(shè)備難以承受的,因此只有為人工智能算法模型重新開發(fā)專門的芯片才有可能滿足本地的計算要求,。
從這個角度來看,,人工智能在消費者場景實現(xiàn)的關(guān)鍵是對算法模型優(yōu)化和用戶場景的綜合理解,,以及底層硬件的設(shè)計制造,。而人工智能的企業(yè)應(yīng)用則會是巨頭們的游戲。
四,、人工智能的產(chǎn)業(yè)生態(tài)
人工智能產(chǎn)業(yè)主要由底層可應(yīng)用技術(shù)(圖像識別,、語音識別、自然語言處理、硬件技術(shù)等),、計算資源(大規(guī)模GPU集群),、基礎(chǔ)數(shù)據(jù)服務(wù),以及企業(yè) /政府/消費者應(yīng)用組成,。遵循產(chǎn)業(yè)的一般發(fā)展規(guī)律,,人工智能的發(fā)展路徑仍然是從底層可應(yīng)用技術(shù)的成熟開始,再到商業(yè)化計算資源,、數(shù)據(jù)服務(wù)等基礎(chǔ)設(shè)施的完 善,,最后形成企業(yè)和消費者應(yīng)用的繁榮。
目前還是人工智能的早期階段,,我們需要關(guān)注的是三方面的發(fā)展:一方面是底層可應(yīng)用技術(shù)的突破,,包括算法的和硬件的;另一方面是中間的數(shù)據(jù)服務(wù)和 計算資源利用的進步;最后也是最重要的是,基于現(xiàn)有技術(shù)的應(yīng)用場景的發(fā)掘,。其中,,底層技術(shù)不一定是“獨門秘技”,能夠把底層技術(shù)商業(yè)化的公司一定是因為自 身的成本曲線優(yōu)于大部分用戶的成本曲線,。如果不滿足這個特性,,那么某些企業(yè)即使有短暫的技術(shù)領(lǐng)先,最后都難以實現(xiàn)大規(guī)模商業(yè)化,。
五,、風(fēng)起于青萍之末
乍看上去,人工智能是個巨頭間的游戲,,巨頭企業(yè)無論從資本,、人才還是技術(shù)積累上似乎都更有優(yōu)勢。然而事實未必如此,。如果以汽車行業(yè)做類比,,汽車 電動化的先驅(qū)并非寶馬、大眾這樣的傳統(tǒng)汽車巨頭,,而是特斯拉這樣的“小”公司,。這其中的原因在于,大公司面對創(chuàng)新變革時,,往往看不上小機會,,因為小機會對 它們的吸引力實在太小了。巨頭們往往喜歡憋大招,,喜歡一步到位,,從而徹底甩開競爭對手。但是創(chuàng)新,、特別是針對大眾消費者的創(chuàng)新卻是循序漸進的,,所謂“大 招”中其實包含著不少對用戶需求的錯誤假設(shè),。小步快跑,不斷尋求和用戶互動,,積跬步終能致千里,。因此,創(chuàng)業(yè)公司在人工智能的創(chuàng)新變革中反而會更有機會,。從 Google和Yahoo在搜索領(lǐng)域,,到Facebook和MySpace在社交領(lǐng)域,再到Apple和Nokia在手機領(lǐng)域,,最終變革的主導(dǎo)力量其實都 是“小”公司,。
基于這個方向判斷,有志于在人工智能領(lǐng)域挑戰(zhàn)巨頭的創(chuàng)業(yè)者們需要先想清楚三件事:
一,、人工智能改變了什么,。偉大的產(chǎn)品或技術(shù)一定是改變了消費者在某些場景下的行為,有沒有都一樣的產(chǎn)品,,很難給消費者使用它的理由,。人工智能相 關(guān)產(chǎn)品核心是要能夠替代一部分人的功能或者提高人的效率,那么在這個大前提下要考慮兩個小問題,,第一個是,,產(chǎn)品對應(yīng)的用戶場景下人的介入頻次高不高,頻次 決定了這個產(chǎn)品的天花板,。第二個是,,這個應(yīng)用場景下替代掉的人的價值有多大,顯然替代掉的這部分價值轉(zhuǎn)化成了產(chǎn)品的內(nèi)在價值,。最后不妨做一個乘法,,把產(chǎn)品 所替代的工作/操作的頻次乘以每次工作/操作能夠產(chǎn)生的價值,這個乘積越大說明人工智能在該應(yīng)用場景中發(fā)揮的作用越大,。
二,、該方向上的人工智能是否能夠?qū)崿F(xiàn)。人工智能的許多技術(shù)都還沒到非常成熟的地步,。之前提到,,創(chuàng)業(yè)者的優(yōu)勢在于小步快跑,因此在人工智能還不成 熟的領(lǐng)域,,一味追求技術(shù)上的突破來解決所有問題并不可取,。無法解決一個通用場景就從幾個專門的場景先入手,無法做出一個“萬能”的產(chǎn)品不妨先做出一個可以 用的產(chǎn)品,。只有用戶使用了產(chǎn)品并給予反饋,,才可能真正知道自己產(chǎn)品的缺陷和下一步的方向。
三,、人工智能能否成為該產(chǎn)品的核心競爭力,。核心競爭力是一個產(chǎn)品的拳頭,如果拳頭不硬,,這個產(chǎn)品無疑打開不了市場,。因此產(chǎn)品的核心競爭力如果是 人工智能,那么該方面的人工智能必須是完美適用于該特定場景的,。如果產(chǎn)品倚重的是還存在很多瑕疵的人工智能技術(shù),,那么這個產(chǎn)品本身的被接受程度就會很不理 想。但不要籠統(tǒng)地認(rèn)為人工智能技術(shù)的某些局限會成為產(chǎn)品的絆腳石,。以特斯拉電動車為例:電池性能至今還在很多方面限制著電動車的表現(xiàn),,依然有很多用戶青睞 特斯拉,原因是特斯拉的核心競爭力在于它出色的啟動,、智能化的駕駛體驗和簡易的維護,,電池盡管是一個短板但不是核心功能。因此,,關(guān)鍵仍然在于定義自己的核 心競爭力,,并確保在核心競爭力上的技術(shù)是經(jīng)得起推敲的。
人工智能已經(jīng)走出了象牙塔,,在企業(yè)和消費者端的應(yīng)用有了顯著進步,。但這仍然不夠。如何讓消費者手中的設(shè)備擁有盡可能多的處理能力,,需要技術(shù)和應(yīng)用的雙端突破,,這也正是人工智能領(lǐng)域創(chuàng)業(yè)公司的機會和任務(wù)所在——人工智能之風(fēng),在未來會起于青萍之末,。