5月17日,,2021搜狐科技5G&AI峰會在北京隆重召開。阿里巴巴集團(tuán)副總裁,、達(dá)摩院城市大腦實(shí)驗(yàn)室主任華先勝作為嘉賓,發(fā)表了題為《人工智能技術(shù)規(guī)?;瘧?yīng)用的探索與實(shí)踐》的主題演講,。在他看來,AI平臺化是AI未來發(fā)展趨勢,,未來將“無行業(yè),,不AI”。(詳見文章《阿里巴巴華先勝:AI平臺化是AI未來發(fā)展趨勢 | 搜狐科技5G&AI峰會 》)
演講后,,他接受了搜狐科技的專訪,,針對技術(shù)在真實(shí)世界的通用性、智慧城市的切入點(diǎn)和難點(diǎn),、國內(nèi)人工智能的優(yōu)勢和薄弱點(diǎn)以及圖片搜索于電商的意義等多個(gè)問題進(jìn)行了一一解答,。
在他看來,中國在人工智能領(lǐng)域的發(fā)展既存在優(yōu)勢,也有薄弱點(diǎn),?!霸谥袊绕涫窃趹?yīng)用技術(shù)創(chuàng)新應(yīng)用方面,,做得既深入又廣泛,。這跟社會對新技術(shù)的接納態(tài)度很有關(guān)系,不論是政府還是企業(yè),,都很愿意嘗試用新的技術(shù)解決行業(yè)的問題和推動(dòng)行業(yè)的變革,。另外,中國的人才也比較豐富,,各個(gè)層級的人才都有,,各個(gè)方面的人才都有,這也是非常好的優(yōu)勢,?!?/p>
不過,華先勝表示,,國內(nèi)在通用的原創(chuàng)技術(shù)上可能會稍弱一些,,但也有不少人在為此努力。
衡量人工智能價(jià)值,,可以從其“通用性”來判斷,。這里的通用性并非是指AI跨行業(yè)的通用性,而是指AI從實(shí)驗(yàn)室環(huán)境遷移到現(xiàn)實(shí)世界的能力,?!巴ㄓ眯允俏覀冏黾夹g(shù)研發(fā)時(shí)一開始就會考慮的問題?!?/p>
華先勝解釋稱,,在人工智能落地的過程中,每個(gè)階段都有不同的關(guān)注重點(diǎn),。首先是算法的準(zhǔn)確率,,然后逐漸過渡到計(jì)算效率和普適性提升?!拔覀儠谡鎸?shí)的大數(shù)據(jù)場景下不斷地對算法進(jìn)行打磨和迭代,,但如果只是做基礎(chǔ)科研的話,就不見得會關(guān)心這個(gè)問題,。因?yàn)榘鸭夹g(shù)遷移到真實(shí)環(huán)境下,,問題往往會變得更深,更復(fù)雜,,更有挑戰(zhàn),。”
華先勝所專注的智慧城市領(lǐng)域,就是人工智能最重要的落地場景之一,,也是一個(gè)眾多公司都在參與競爭的火熱賽道,。“同行們有從端(傳感器)切入的,,有從應(yīng)用層切入的,,有從算法角度切入的,還有從AI能力平臺角度切入的,;當(dāng)然,,也有從AI技術(shù)研發(fā)平臺角度切入的?!?/p>
盡管業(yè)內(nèi)做法不一,,但華先勝表示,憑一家之力,,很難從底層到應(yīng)用層全部做到盡善盡美,。更好的方式是,每一部分都有更專長的人做,。“這也同時(shí)會帶來一個(gè)問題,,就是行業(yè)內(nèi)需要一份標(biāo)準(zhǔn)和規(guī)范,,能夠讓不同的團(tuán)隊(duì)、不同的公司,、不同的服務(wù)的提供方形成合力,。不至于在每個(gè)城市里,一部分是這家公司做的,,另外一個(gè)部分那家公司做的,,最后各自為政?!?/p>
除了上述談到的國內(nèi)人工智能的優(yōu)勢和薄弱點(diǎn),、技術(shù)通用性等問題外,普通大眾可能對“買買買”更為熟悉,。值得一提的是,,“搜同款神器”——手機(jī)淘寶中 “拍立淘”,其背后的技術(shù)就是由華先勝首創(chuàng)和實(shí)現(xiàn)的,。
當(dāng)談及圖片搜索對于電商生態(tài)的意義時(shí),,華先勝表示:“通過圖片來搜索商品是圖像搜索絕佳的應(yīng)有場景,這是一個(gè)剛性的需求,,解決的是文本搜索和瀏覽無法解決的問題,。”這也是圖片搜索永遠(yuǎn)在電商搜索中占據(jù)一席之地的原因。
嘉賓簡介:
華先勝,,現(xiàn)任阿里巴巴集團(tuán)副總裁,、高級研究員、達(dá)摩院城市大腦實(shí)驗(yàn)室主任,。
華先勝是國際電氣與電子工程師協(xié)會會士(IEEE Fellow),,美國計(jì)算機(jī)協(xié)會杰出科學(xué)家(ACM Distinguished Scientist);2008年獲MIT技術(shù)評論“全球35個(gè)35歲以下杰出青年創(chuàng)新者”稱號(TR35),。
華先勝1996年和2001年畢業(yè)于北京大學(xué)數(shù)學(xué)學(xué)院,,分別獲學(xué)士和博士學(xué)位;之后分別工作于微軟亞洲研究院,,微軟美國必應(yīng)搜索引擎,,以及微軟美國研究院,從事多媒體,、計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)方面的研發(fā)工作,。2015年4月加入阿里巴巴,任搜索事業(yè)部資深總監(jiān)/研究員,;2016年加入阿里云iDST,,負(fù)責(zé)云上視覺智能計(jì)算的技術(shù)研發(fā);現(xiàn)任阿里達(dá)摩院城市大腦實(shí)驗(yàn)室主任,。他的研發(fā)興趣在大規(guī)模視覺人工智能領(lǐng)域,,包括視覺分析、識別,、搜索和挖掘等,。華先勝在國際主流會議和期刊上發(fā)表論文200余篇,擁有專利90余項(xiàng),。曾擔(dān)任多個(gè)學(xué)術(shù)期刊的副主編以及ACM Multimedia等頂級學(xué)術(shù)會議的程序委員會主席,,并獲得多個(gè)國際會議及期刊的最佳論文獎(jiǎng)。華先勝曾擔(dān)任ACM Multimedia 2020年大會主席,。
以下為專訪實(shí)錄精編:
搜狐科技:感謝阿里集團(tuán)副總裁,、達(dá)摩院城市大腦實(shí)驗(yàn)室主任華先勝參加搜狐科技的專訪。華老師您好,,首先請您跟大家介紹一下達(dá)摩院和您的研究方向,?
華先勝:達(dá)摩院是阿里巴巴的基礎(chǔ)科研和基礎(chǔ)創(chuàng)新研發(fā)的核心機(jī)構(gòu)。目前實(shí)驗(yàn)室有5個(gè)方向,,包括機(jī)器智能,、數(shù)據(jù)計(jì)算、機(jī)器人,、金融科技和X實(shí)驗(yàn)室,。我自己所在的實(shí)驗(yàn)室是人工智能方向,,是人工智能從基礎(chǔ)的技術(shù)研發(fā),到形成產(chǎn)品,,再到到產(chǎn)品落地應(yīng)用場景的一條龍的團(tuán)隊(duì)建制,。
搜狐科技:就像您介紹的,達(dá)摩院是研究基礎(chǔ)科學(xué)的創(chuàng)新技術(shù)研究的機(jī)構(gòu),,實(shí)驗(yàn)室的環(huán)境和真實(shí)世界還是有一定的不同的,,想問問您,為了讓技術(shù)在現(xiàn)實(shí)世界中取得更好的效果,,目前是否有哪些難點(diǎn)和技術(shù)解決方案呢,?
華先勝:通用性是我們做技術(shù)研發(fā)一開始就會考慮的問題,這個(gè)通用性不是指行業(yè)通用性,,而是指在真實(shí)世界的復(fù)雜場景下有沒有通用性,,除了通用性之外,計(jì)算的效率有多高,,也是我們會考慮的問題,。
當(dāng)然最初的時(shí)候,算法的準(zhǔn)確率上是技術(shù)研究人員們更關(guān)注的方向,,但是我們逐步會把它的效率和普適性提升放在更重要的位置,。其實(shí),一開始我們就關(guān)注這個(gè)最終的目標(biāo),。
我們會在真實(shí)的大數(shù)據(jù)場景下做不斷的打磨和迭代,,如果是做基礎(chǔ)科研的話可能會更關(guān)注基礎(chǔ)算法的創(chuàng)新。
在應(yīng)用場景下能夠取得突破,,其實(shí)相對于在封閉數(shù)據(jù)集上做科研,是一件更難的事情,。問題會變得更深,,變得更復(fù)雜,更有挑戰(zhàn),,我們花費(fèi)了很大的精力,,讓技術(shù)在規(guī)模上、在真實(shí)場景中應(yīng)用中去實(shí)驗(yàn),,在實(shí)踐中檢驗(yàn),,在實(shí)踐中去磨煉。
搜狐科技:您目前的研究方向是城市大腦,,智慧城市領(lǐng)域越來越多受到業(yè)內(nèi)的關(guān)注,,很多的同行們都在跟進(jìn)這個(gè)方向,在您的觀察里面,,大家的切入點(diǎn)都有哪些不同,?
華先勝:切入點(diǎn)都沒有什么太大問題,,可以從傳感器端上切入,AI放在端上做也是可以的,;也可以從服務(wù)器端的算法切入,,解決一些核心問題;還可以從AI平臺切入,,提供平臺層的能力,,賦能其他開發(fā)者;從應(yīng)用層切入也是常見的方式,,能夠基于其他的團(tuán)隊(duì)提供的AI平臺,,去做智慧城市的各個(gè)領(lǐng)域,比如說各委辦局等等具體部門的業(yè)務(wù)所需要的能力,;當(dāng)然,,從AI技術(shù)研發(fā)平臺這個(gè)角度切入也是可以的。
實(shí)際上也是智慧城市也是需要大家一起來繁榮的,。很難說誰的切入點(diǎn)一定是對或者一定是錯(cuò),。
一般來說,一家公司很難從底層到上面最后的應(yīng)用層全部都做了,。更多的是每一部分都有更專長的人做,,專業(yè)的人做專業(yè)的事情,這個(gè)才是最好的,。
當(dāng)然這里面也帶來一個(gè)問題,,就是怎樣能夠形成一個(gè)規(guī)范,能夠不同的團(tuán)隊(duì),、不同的公司,、不同的服務(wù)的提供方能夠形成合力,這個(gè)標(biāo)準(zhǔn)和規(guī)范是急需解決的一個(gè)問題,,這樣才能真正形成合力,,不至于說每個(gè)城市里面,這個(gè)是他做的,,另一個(gè)地方是另外一家做的,,最后各自為政,這就不太好了,。
搜狐科技:那現(xiàn)在的情況是否就像您剛剛提到的呢,?
華先勝:應(yīng)該會慢慢變化,我們也在推動(dòng)規(guī)范和標(biāo)準(zhǔn)的建立,。
搜狐科技:您先后有國外和國內(nèi)兩段研究的經(jīng)歷,,想問您一下,國內(nèi)相對于國外來說,,在人工智能上的優(yōu)勢和發(fā)力點(diǎn)有什么不一樣嗎,?
華先勝:在中國,,尤其應(yīng)用技術(shù)創(chuàng)新應(yīng)用方面,做得既深入又廣泛,,這跟社會對新技術(shù)的接納態(tài)度很有關(guān)系,。不論是政府還是企業(yè),都很愿意嘗試用新的技術(shù)解決行業(yè)的問題和推動(dòng)行業(yè)的變革,,中國是一個(gè)非常好的環(huán)境,。另外,中國的人才也比較豐富,,各個(gè)層級的人才都有,,各個(gè)方面的人才都有。所以,,在解決行業(yè)的問題上的這些創(chuàng)新,,中國是非常占有優(yōu)勢的,在世界上也是走在前沿的,。
至于也有人認(rèn)為,,中國原創(chuàng)的技術(shù)要稍弱一點(diǎn),其實(shí)中國也有不少原創(chuàng)的東西,,但相對來說,,通用的原創(chuàng)技術(shù)可能會稍微少一點(diǎn),比如說一些基礎(chǔ)模型,,可能會比應(yīng)用技術(shù)的研發(fā)相比稍微弱一點(diǎn),,現(xiàn)在也看到很多人做這方面的事情。
搜狐科技:您介紹了很多技術(shù)相關(guān)的內(nèi)容,,但普通大眾對“買買買”更感興趣,,手機(jī)淘寶里面的“拍立淘”背后的技術(shù)就是由您開創(chuàng)的,請您簡單介紹一下,,圖片搜索對于電商生態(tài)有什么重要性,?
華先勝:圖像搜索并不是阿里巴巴原創(chuàng),上世紀(jì)90年代就有很多人做這方面的研究,,那時(shí)候叫做圖像檢索,有很多人因?yàn)檫@方面的研究而獲得了博士學(xué)位的,。
但是那個(gè)時(shí)候的技術(shù)跟今天還是有很大差別的,,深度學(xué)習(xí)技術(shù)和索引技術(shù)起來了以后,才使得這項(xiàng)技術(shù)真正能夠應(yīng)用起來,。
之前很多人,,包括我在微軟的時(shí)候,也做過這樣的工作,,大多是通用的場景,,但通用的場景目前來看不是一個(gè)特別剛性的需求,。
但是電商的場景不一樣,通過圖片來搜索商品是圖像搜索絕佳的應(yīng)用場景,,也是剛性的需求,,解決的是文本的搜索和瀏覽無法解決的問題。因?yàn)楹芏鄨鼍爸挥型ㄟ^這種方式才能搜索:你看中了這個(gè)商品,,但是你沒辦法準(zhǔn)確知道商品名字,,這時(shí)候你只能通過拍照來進(jìn)行搜索。
當(dāng)然,,這個(gè)功能還可以搜索同款,、相似款,比如“神似”的東西,,兩者很像,,但其實(shí)并不是一個(gè)商品,這些通過文字都無法實(shí)現(xiàn),。 圖片搜索目前在電商搜索中里面占了一定的量,,主流還是在文字和瀏覽,但是它切實(shí)解決了一個(gè)過去解決不了的問題,,所以用戶量也不少,。