在1月20日《最強大腦》人機大戰(zhàn)第三場的比賽中,,百度大腦2比0輕松戰(zhàn)勝人類選手王昱珩,。然而賽后觀眾齊齊質(zhì)疑節(jié)目有黑幕,,在網(wǎng)上掀起了對百度的新一輪討伐。
百度投入重大財力與人力參加《最強大腦》,,意圖展示其人工智能水平,。然而從節(jié)目播出效果來看,百度非但沒能在技術(shù)上贏得漂亮,,反而背上了“造假”罵名,,贏家慘變最大輸家。
百度很郁悶:贏了當輸 花錢挨罵
根據(jù)百度人臉識別團隊成員的說法,,為了這幾場人機大戰(zhàn),,百度方面悉心準備了近半年,,還做了《最強大腦》的贊助商,,而在15年伊利在該節(jié)目的冠名贊助費高達2億,百度這個特約贊助商至少也是數(shù)千萬水平,。此役百度可謂出錢又出力,。眼看百度此次最強大腦之旅即將取得一石二鳥的成果——既展現(xiàn)了自家技術(shù)水平,又提升了對外形象,。然而百度的小算盤卻打了個空,。
在過去的一年中,百度的公關(guān)形象呈跳樓態(tài)勢急墜,,致使許多人將百度拉入“誠信黑名單”,。在節(jié)目播出后,王昱珩的失敗在《最強大腦》的觀眾中激起軒然大波,,粉絲們紛紛到其微博最不強大腦王昱珩下留言詢問情況或表示惋惜,。
人們無法相信這個擁有神一般觀察力的男人一題未對,尤其在對手是“屢有前科”的百度的情況下,。觀眾紛紛質(zhì)疑百度買通節(jié)目組造假,,內(nèi)定百度大腦獲勝。甚至在節(jié)目播出之前,,就有流言稱王昱珩在節(jié)目中事先是選出了正確答案,,隨后又擦掉寫上了錯誤的,而這與節(jié)目播出的內(nèi)容一致,。
節(jié)目組顯然提前預(yù)料到了觀眾的反應(yīng),,在節(jié)目結(jié)束后很快便在官微上發(fā)布了一篇長文對情況作了說明,否認了黑幕的存在,。
另外一邊,,節(jié)目科學評審魏坤琳和選手本人也進行了一場直播,,表示沒有黑幕。百度大腦團隊成員也在知乎上稱,,工程師不屑于搞黑幕,。一位自稱參與了現(xiàn)場錄制的觀眾也在知乎上回答,王昱珩擦掉正確答案再寫上錯誤的鏡頭是后期補錄,,為的是讓觀眾認為他有實力獲勝,,只是“發(fā)揮不佳”,這樣不至于輸?shù)锰珣K,。
然而輿論的漩渦已經(jīng)形成,,觀眾們紛紛認定事有黑幕,在網(wǎng)上大罵百度造假,,順便還帶上了最強大腦節(jié)目組,。
考慮到這只是一檔電視節(jié)目,有臺本,、修改,、剪輯按理十分正常,然而最強大腦一貫對外宣傳節(jié)目的絕對真實性,,使得觀眾對其“表演”,、“內(nèi)定”的容忍度十分低。
百度作為節(jié)目的贊助商,,既當金主又當選手的做法,,也加深了眾人的懷疑。盡管沒有直接證據(jù)證明結(jié)果內(nèi)定,,參賽各方也出來辟謠,,然而并沒能挽回一邊倒的“黑幕”聲音,百度硬生生接下了這口“造假”的黑鍋,。其花重金上舞臺宣傳其人工智能技術(shù)的設(shè)想未能實現(xiàn),,改善對外形象的想法也落空,反倒落了罵名,,不管這是否真的只是一場秀,,百度都未能獲得任何實質(zhì)性的好處。
賽事復(fù)盤 百度到底如何取勝
在《最強大腦》人機大戰(zhàn)的項目中,,之前與人的兩場對戰(zhàn),,百度大腦一勝一平?!蹲顝姶竽X》節(jié)目組特意請出了呼聲極高的王昱珩,,后者此前在節(jié)目中憑借“微觀辨水”的絕活,從520杯無色無味的水中準確地挑出了嘉賓選擇的那一杯,一戰(zhàn)成名,,獲稱“水哥”,。
第三戰(zhàn)將是人機大戰(zhàn)的終極對決。于人工智能而言,,它是一場對技術(shù)發(fā)展成果的檢驗,;于人類而言,這場對決再一次(上一次是Master)關(guān)乎人類的尊嚴,。
在這場比賽中,,百度大腦和“水哥”王昱珩比拼的仍然是圖像識別。通過三段在夜幕下分別從行車記錄儀,、高位攝像頭,、和手機中拍到的模糊動態(tài)影像,雙方需要記住三名不同識別對象的面部特征,,然后從節(jié)目現(xiàn)場的30人中將他們辨認出來,。
相對于第一場目標清晰的情況,這次識別對象戴了口罩,、帽子,,并且是在光線陰暗的條件下一閃而過,使得可觀察的特征和細節(jié)大大減少,,讓識別難度陡然提高,。
王昱珩肩負著捍衛(wèi)人類尊嚴的使命,更是在比賽中放出豪言將成為百度大腦的“滑鐵盧”,,并私下同節(jié)目組溝通要求把識別環(huán)境的光線再調(diào)暗20%,進一步加大了識別難度,。
然而隨著比賽結(jié)果揭曉,,挑戰(zhàn)要求識別的三名識別對象,百度大腦找出了兩名,,王昱珩卻一名都未找對,。。在《最強大腦》舞臺上與人類的三場對戰(zhàn)中,,百度大腦兩勝一平,,保持不敗。
而在第一場人機大戰(zhàn)人臉識別的比拼中,,雙方進行了兩輪較量,,需要根據(jù)年齡跨度近二十年的照片中找出真人。百度大腦最后以3比2戰(zhàn)勝人類記憶大師王峰,,尤其是根據(jù)一張模糊的童年照片,,從一對高度相似的雙胞胎中準確地認出了識別對象,完成了常人無法完成的任務(wù),。
在第二場的聽音辨人中,,比賽項目則是從21位性別相同,、年齡相仿、聲線極為相似的專業(yè)合唱團中,,選出三位每個人讀一句話,,加密后成為斷斷續(xù)續(xù)的聲音樣本再交給百度大腦和人類選手,要求他們從合唱聲音中識別出三名線人的聲音,。百度大腦與被譽為擁有“絕對聽力”的孫亦廷1比1戰(zhàn)平,。在備選的3人中,雙方都只選對了1名,。有趣的是,,賽后百度語音識別團隊的成員稱,百度大腦內(nèi)置的兩道算法分別認出了兩名備選人,,然而在進行算法融合時,,“出現(xiàn)了小概率事件”,只篩選出了一人,。這似乎是想說明百度在語音識別方面的能力也是強于人類的,。
人機大戰(zhàn)背后 百度做了哪些事
對于百度的人工智能技術(shù),需要補充一點背景,。
科大訊飛研究院院長胡郁認為人工智能主要分為三個維度,,同時它們也代表了人工智能發(fā)展的三個階段:運算智能、感知智能,、認知智能,。
在之前數(shù)十年,人工智能呈現(xiàn)的主要是最底層的運算智能,,表現(xiàn)形式即各類的計算平臺,。
而在上世界80年代,人工智能領(lǐng)域從人腦的神經(jīng)系統(tǒng)模式中吸取靈感,,構(gòu)造出了人工神經(jīng)網(wǎng)絡(luò),,使人工智能開始步入感知智能階段。
這種新的運算模型用自身結(jié)構(gòu)的復(fù)雜性簡化了運算的難度,,通過把占據(jù)不同權(quán)重的神經(jīng)元連接起來并行分布式運算,,一定程度上克服了傳統(tǒng)運算程序難以處理非結(jié)構(gòu)化信息的短板。由此,,它使得人工智能獲得了深度學習的能力:無需人工對數(shù)據(jù)做復(fù)雜的預(yù)前處理,,就可以從大量的數(shù)據(jù)中抽取出它們更深層的共同特征。
用人話說,,這種方式繞開了把復(fù)雜問題表述為計算機語言的過程,,通過簡單粗暴的大數(shù)據(jù)訓(xùn)練來解決問題,它并不回答“熊長什么樣”,只是看足夠多的熊,,來獲得認出熊的能力,。
這兩年,人工神經(jīng)網(wǎng)絡(luò)的成果極大地促進了人工智能領(lǐng)域在計算機視覺與自然語言處理方面的進步,,讓計算機獲得了“看”與“聽”的能力,。
百度的面部識別和語音識別,對應(yīng)的就分別是感知智能中的“看”與“聽”,。
面對人類頂尖高手的車輪挑戰(zhàn),,百度大腦為何能保持不敗,?主要在于以下三個方面,。
1、海量數(shù)據(jù)與訓(xùn)練
在百度方面的說法中,,其人臉識別準確率達到了97.7%,。在人臉識別技術(shù)兩個最為權(quán)威的國際評測FDDB與LFW中,百度都獲得了第一名,。而這個成績背后,,是巨大的數(shù)據(jù)與海量的訓(xùn)練。百度大腦團隊稱其通過超過2億的面部圖像數(shù)據(jù)來進行深度學習,,用大規(guī)模的訓(xùn)練,,讓百度大腦自身建立了一整套人臉特征提取與比對模式,成為了人臉識別方面的專家,。
而在聲音方面,,百度同樣擁有龐大的數(shù)據(jù)庫。并且在上節(jié)目前兩個月,,百度大腦團隊就開始特別面向聲紋識別對算法進行了優(yōu)化以及訓(xùn)練,。
2、過目不忘的記憶
同時百度大腦在記憶力上占據(jù)絕對的優(yōu)勢,,信息一旦進入其存儲單元就可以被原封不動地保存與提取。而人類選手卻不得不擔心遺忘以及后攝信息對之前記憶的干擾,。在節(jié)目的賽程設(shè)計中,,主要信息都是需要記憶的,這使得機器的勝算大大增加,。
3,、沒有情緒問題
盡管百度方面特意拿出了“小度”這樣一個萌萌的機器人來與現(xiàn)場進行互動,營造親和感,。然而它其實是由人工控制的,,其互動語音都是工作人員打的字。百度大腦沒有感情,沒有壓力,,不會猶豫,。它既不會感受到百度工程師團隊對它傾注的殷切期望,也聽不到現(xiàn)場觀眾的喝彩或者噓聲,。它只是一個冷冰冰的任務(wù)執(zhí)行者,,不會有任何人類選手所謂的臨場感、情緒波動,,只會根據(jù)任務(wù)進行對比,,給出匹配概率。
盡管人類在百萬年的進化中,,發(fā)展出來了對人臉與人聲直覺性的感知,,然而卻不曾擁有百度大腦在數(shù)據(jù)訓(xùn)練、記憶能力以及情緒穩(wěn)定性方面的優(yōu)勢,。并且,,選手往往是獨自應(yīng)戰(zhàn),百度大腦身后站著的,,卻是一整個工程師團隊,。
另外,王昱珩主動要求調(diào)低影像的做法,,除了給自己添堵,,并沒有給百度大腦增加難度——機器人對人臉面部特征的提取主要依靠的是對比度,整體亮度變化影響不大,。
因此,,在機器一方占據(jù)多種優(yōu)勢的情況下,選手戰(zhàn)平或輸給百度大腦,,在現(xiàn)今的技術(shù)或者情面上也是理所應(yīng)當,。
百度沒贏的,不僅僅是口碑,,還有技術(shù)
在第三場比賽中,,還有一個容易被忽略但值得關(guān)注的細節(jié):第二名需要識別的對象是一個身形明顯較胖的人(8號),百度大腦卻選了一個體型差異巨大的瘦子(29號),。這般反應(yīng),,讓人難以相信這是國內(nèi)領(lǐng)先的人臉識別技術(shù)。
這不禁讓人感慨,,百度人臉識別果然是只認臉,,連胖瘦都不管了。百度大腦的這個明顯失誤其實反映了人工智能目前存在的問題:強于感知,,弱于認知,,甚至在感知上,,都是割裂的。
盡管人工智能已經(jīng)取得了長足發(fā)展,,但它仍然處在初級階段,,未能達到認知智能。現(xiàn)今的人工智能仍然是由人類圈定一個既定的領(lǐng)域,,提出一個有封閉邊界的問題,,讓機器人通過大量數(shù)據(jù)進行反復(fù)訓(xùn)練來獲得解。它并不會像人類一樣,,從小量樣本中就能提取關(guān)鍵點,,并用語言將其描述出來。
換句話說,,人工智能目前只知道怎么做,,而不知道為什么,只能用笨辦法去針對特定領(lǐng)域“苦練”,,而不能在高層次上綜合地去“理解”,,這極大地限制了人工智能的學習效率與能力。
百度大腦識別第二名對象時所出的bug,,正是其初級階段的表現(xiàn)——它應(yīng)對的問題完全被圈定,,對于人臉之外的特征,即便十分重要,,也根本不關(guān)心,。雖然百度方面稱其人臉識別在國際比賽中名列第一,但其識別情景都是相對標準化的,。而在實際應(yīng)用中,,情況千變?nèi)f化,并沒有太多標準化的可能,,第三場比賽的項目便是絕好的例子,。
按照百度官方的說法,其識別錯誤率僅為2%左右,。然而在30選3的識別中就出現(xiàn)了如此離譜的錯誤,,也讓人為其在實際應(yīng)用中的可靠性打了個問號。
如果必須依賴標準化圖像才能達到超高的識別率,,那么百度的成果只能停留在實驗室中,。
技術(shù)之外:人工智能該如何被接納
而從百度的輸贏中跳出來,網(wǎng)上鋪天蓋地的質(zhì)疑聲,,也引發(fā)了筆者的思考:百度大腦被罵,只是因為它屬于百度,?這背后跟人工智能本身真的毫無關(guān)系,?
北大心理學院的劉嘉教授表示,,百度的人工智能機器人,說到底也只是一個具有學習能力的機器人,,他還不具備人類的情感,。在它的世界里只有理智和邏輯,只有算法組成的勝率,。而和它對戰(zhàn)所有選手雖然具有逆天的能力但是依然是一個感性的人,,所有觀眾也都是憑著一顆感性的心去看這檔節(jié)目。當感性的人看見冷冰冰的理性,,當結(jié)果非心理預(yù)判的時候,,感性的評判會壓倒所有理性的思考。
從這期節(jié)目中我們也可以看出,,當人工智能和人類處在一種對立的情況下時,,人類會天然地維護自己的族群,即便它是以一種服務(wù)性的態(tài)勢進入人們的生活,,它也會遭到反對,。
當人工智能崛起時,必然會在各個細分領(lǐng)域逐漸超越人類,,今天是圍棋,、人臉識別與語音,明天或許就是駕駛,、醫(yī)療,、教育。每一次的重大技術(shù)變革都會有陣痛,,其直觀表現(xiàn)就是一批職業(yè)的消失,。蒸汽機的出現(xiàn)趕走了織布工,汽車的出現(xiàn)趕走了馬夫,。過去需要擔心自身未來的是體力勞動職業(yè),,而人工智能的來臨將讓腦力勞動者也開始惶恐。如果人工智能的推廣在提供一個足夠大的蛋糕之前就分走了現(xiàn)有的蛋糕,,必然會遭到利益受損者的激烈反對,。AlphaGo能安然接受人們的膜拜,除了圍棋選手們的虛心態(tài)度,,更重要的是它涉及的領(lǐng)域沒有觸動太多人的利益,。
科技界一眾大佬表示對人工智能的憂慮,并不在強人工智能可能滅絕人類,,而在于人工智能進入人類生活的過程中,,將對社會可能造成的廣泛沖擊。
要讓人工智能順利地嵌入人類社會的各方面,,要平滑地實現(xiàn)這個過程,,絕非一句產(chǎn)業(yè)升級就能簡單帶過,。