3月22日,百度舉行了首期語音搜索開放日活動(dòng),向媒體展示自己正在蓄力的最新技術(shù)應(yīng)用——語音搜索,。百度公司技術(shù)副總裁王海峰現(xiàn)場介紹了百度語音搜索的最新進(jìn)展,,另有兩位 搜索技術(shù)負(fù)責(zé)人對(duì)語音搜索的實(shí)際使用問題進(jìn)行了演示說明。在活動(dòng)中,,百度方面接受采訪時(shí)表示:堅(jiān)信語音交互將是人機(jī)交互的趨勢所在,,這個(gè)趨勢將取代鍵盤輸入。此外百度方面還向新浪科技透露:今年將有重磅產(chǎn)品推出,,會(huì)讓去年百度世界大會(huì)推出的度秘更加厲害,。
百度語音搜索開放日:百度大搜索總產(chǎn)品架構(gòu)師景鯤(左)、百度技術(shù)副總裁王海峰(中),,百度多模搜索部總監(jiān)孫雯玉(右)
語音搜索≠聽+說
百度技術(shù)副總裁王海峰
“語音搜索最常見的誤區(qū)是簡單以為只是聽和說的簡單串聯(lián),,其實(shí)并非如此?!蓖鹾7彘_門見山說道,。
這位百度技術(shù)副總裁緊接著對(duì)百度語音搜索的最新進(jìn)展進(jìn)行了介紹,表示目前的技術(shù)已經(jīng)實(shí)現(xiàn)了語音技術(shù),、自然語言處理,、智能搜索三方面的融合,以更自然的交互方式,,對(duì)用戶所說更準(zhǔn)確地識(shí)別,,對(duì)需求理解更精準(zhǔn),進(jìn)而能提供更滿意的結(jié)果,。
王海峰現(xiàn)場進(jìn)行了演示,,“請(qǐng)問三亞明天的天氣怎么樣?”他按住語音助手說,,搜索框隨機(jī)“打出”了王海峰的問題,,并跳轉(zhuǎn)到天氣頁面,還自動(dòng)朗讀起來:明天三亞天氣多云,23℃到31℃……
不過王海峰認(rèn)為詢問天氣只是最基本的語音搜索,,他緊接著演示了三個(gè)問題:“謝霆峰的兒子是誰”,、“謝霆峰是誰的兒子”,“吳奇隆比劉詩詩大多少歲”……
王海峰表示,,前兩個(gè)問題從傳統(tǒng)搜索認(rèn)知來看,,文字是完全一樣的,但問題缺截然不同,,這其中涉及到了對(duì)于語言的理解和語義分析,。最后一個(gè)問題則涉及兩個(gè)結(jié)果綜合之后的計(jì)算。
“百度語音搜索目前已通過人工智能做到了’聽’和’說’,,而且還嘗試完成人類復(fù)雜的行為——溝通,。集成了語音識(shí)別、語義理解,、深度問答,、知識(shí)推 理、多輪對(duì)話,、智能摘要,、情感分析、語言生成,、語音合成等能力,,百度語音搜索已經(jīng)能夠滿足用戶的多種復(fù)雜需求?!蓖鹾7蹇偨Y(jié)說,。
此外,這位百度技術(shù)副總裁也談到了語音搜索和當(dāng)下火熱的人工智能的關(guān)系,。他表示人工智能實(shí)際上是希望讓機(jī)器可以擁有若干能力,,可以讓機(jī)器學(xué)會(huì)人的聽、說,、看,、行,進(jìn)而開始有思考——即機(jī)器學(xué)習(xí),,但就人的思考而言,,和語言密切相關(guān),后者是思考必需的知識(shí)和思維的載體,。
王海峰強(qiáng)調(diào)說,,語音搜索可以降低用戶搜索門檻,而且在大數(shù)據(jù)的基礎(chǔ)上可以轉(zhuǎn)換為更多的互聯(lián)網(wǎng)產(chǎn)品應(yīng)用,,實(shí)現(xiàn)人與信息及服務(wù)的更廣泛連接,。
鍵盤要被消滅
百度多模搜索部總監(jiān)孫雯玉
關(guān)于搜索門檻被降低的問題,,百度多模搜索部總監(jiān)孫雯玉進(jìn)行了進(jìn)一步演示介紹。
她表示語音搜索的好處是比鍵盤輸入“更直接,、更快捷”,。作為年輕媽媽,孫雯玉海舉例說,,女兒現(xiàn)在找動(dòng)畫片會(huì)直接通過語音搜索,,“小孩基本不用教,甚至看你做一遍她就會(huì)了,,她知道按住說話,,就能找到自己想要的?!?/p>
語音搜索的直接和快捷同樣體現(xiàn)在老人群體身上,孫雯玉介紹說父母有山東口音,,但是搜索在語音識(shí)別上沒有問題,,“以前搜索需要組織語言思路,明確自己的問題,,但是現(xiàn)在像我爸媽一樣在文字輸入上不習(xí)慣的群體,,可以直接說,所說即所得,?!?/p>
不過,這位多模搜索部總監(jiān)也表示,,針對(duì)中國方言眾多的情況,,目前的主要版本還只是針對(duì)以普通話為主的北方方言和相近方言,粵語版,、上海話版和西南官話等版本已經(jīng)在開發(fā)中,。
孫雯玉認(rèn)為語音搜索的最大意義在于:通過技術(shù)讓人獲得信息和服務(wù)的門檻更低,隨著智能語音搜索進(jìn)一步向前,,可能會(huì)出現(xiàn)重大卻潤物無聲地變革—— 鍵盤交互將成為歷史,,“我們的調(diào)研顯示,90后,、00后有50%的群體的主要搜索方式已經(jīng)變成了語音,,而我女兒為代表的10后一代,基本從小的習(xí)慣就是語 音搜索,,她們這一代未來會(huì)覺得語音搜索是一件自然而然且天生如此的事情,。”
物聯(lián)網(wǎng)大趨勢
語音搜索比鍵盤輸入搜索更便捷并不令人否認(rèn),,但現(xiàn)場有記者認(rèn)為語音搜索存在“場景”問題,。
有媒體提問稱,,不懷疑語音搜索的效率和便捷程度,但目前來講,,拿著手機(jī)不斷說話搜索需要場景,,特別涉及多輪交互,可能會(huì)變得調(diào)戲Siri一樣——只是個(gè)消遣游戲,。
百度大搜索總產(chǎn)品架構(gòu)師景鯤重點(diǎn)解答了場景問題,。他覺得之所以目前還存在“場景”上的尷尬,主要有兩方面的原因,。
首先是當(dāng)前的用戶習(xí)慣了鍵盤輸入,,對(duì)于語音搜索的轉(zhuǎn)換還需要一段時(shí)間,但不可否認(rèn)的是隨著年輕群體進(jìn)一步壯大,,語音搜索會(huì)成為潮流,,“這個(gè)群體已經(jīng)被微信完成了市場教育,現(xiàn)在在地鐵上對(duì)著手機(jī)說話’看起來傻’的問題,,估計(jì)以后大家都在做并且習(xí)慣了,,就成為潮流了?!?/p>
其次是物聯(lián)網(wǎng)的進(jìn)一步發(fā)展,。景鯤表示,目前人機(jī)交互的最主要終端是手機(jī),,不過一旦物聯(lián)網(wǎng)進(jìn)一步發(fā)展,,人機(jī)交互突破了手機(jī)終端,需要在更多更廣泛的領(lǐng)域進(jìn)行應(yīng)用的時(shí)候,,鍵盤輸入可能會(huì)變得很不方便,,相反,語音輸入的優(yōu)勢會(huì)不言自明,。
景鯤認(rèn)為,,大的潮流和趨勢目前是可以預(yù)見的,語音搜索的普及只是時(shí)間問題而已?,F(xiàn)在手機(jī)屏幕承載的東西特別多,,有屏幕的東西大家都愿意看,沒有屏幕的東西就只能搜了,。從潮流來看,,語音交互絕對(duì)是主流。
新浪科技也就此向百度方面提問:“在物聯(lián)網(wǎng)大趨勢下,,在硬件方面如何考慮,,是否會(huì)涉足硬件領(lǐng)域?”
百度方面給出的回答是:不會(huì)涉足硬件,。
“我們給語音搜索提供一個(gè)全方面的方案,,跟各種各樣的廠商一起來合作,,我們提供的是能力、信息和資源,。我們?nèi)ツ晖瞥隽诵C(jī)器人度秘,,通過它來告訴外界我 們有什么樣的能力,畢竟口說無憑,,百度得把這個(gè)能力包裝成這樣一個(gè)產(chǎn)品,,這些能力也可以放到廠商的設(shè)備上,我們做百度最擅長的,,其他廠商做他們擅長的方 面,。”景鯤回答說,,這個(gè)回答也得到了百度技術(shù)副總裁王海峰的贊同,。
“但度秘在推出后似乎聲勢不大?”新浪科技進(jìn)一步問道,。
孫雯玉回答了該問題,,這位百度多模搜索部總監(jiān)解釋稱,度秘在去年推出是一個(gè)能力的展示,,但度秘的普及應(yīng)用過程中,,可能涉及最多的問題是多輪交 互,,這對(duì)目前的產(chǎn)品形態(tài)和技術(shù)應(yīng)用來說,,一旦有不足,就很容易造成糟糕的用戶體驗(yàn),,所以百度方面并沒有選擇大力推廣,,目的是讓最大程度保證用戶體驗(yàn)。
“但今年會(huì)有重磅得多的產(chǎn)品發(fā)布,,會(huì)讓去年百度世界大會(huì)上推出的度秘更厲害,。”百度大搜索總產(chǎn)品架構(gòu)師景鯤補(bǔ)充道,。