【ChatGPT專(zhuān)題】國(guó)內(nèi)10家大廠爭(zhēng)做ChatGPT,,逐鹿群雄,,誰(shuí)能笑到最后?
2023-02-17
來(lái)源:騰訊網(wǎng)
近期,360創(chuàng)始人周鴻祎對(duì)互聯(lián)網(wǎng)圈進(jìn)行了評(píng)論:在ChatGPT領(lǐng)域,美國(guó)超過(guò)了我們,,中國(guó)公司和科研人員需要加速追趕。
ChatGPT的興起引起了國(guó)內(nèi)外互聯(lián)網(wǎng)公司的關(guān)注,。為了應(yīng)對(duì)ChatGPT的挑戰(zhàn),,谷歌在2月8日緊急推出了人工智能聊天機(jī)器人Bard。國(guó)內(nèi)的百度宣布將于3月初推出“文心一言”,,其他互聯(lián)網(wǎng)公司也紛紛效仿,。
截至2月10日,已經(jīng)宣布擁有類(lèi)似ChatGPT技術(shù)儲(chǔ)備,、準(zhǔn)備發(fā)布和已經(jīng)發(fā)布類(lèi)ChatGPT產(chǎn)品服務(wù)的國(guó)內(nèi)大廠包括:阿里巴巴,、騰訊、華為,、字節(jié)跳動(dòng),、京東,、360,、科大訊飛、快手,、網(wǎng)易有道等,,超過(guò)10家互聯(lián)網(wǎng)巨頭紛紛進(jìn)入了熱門(mén)的ChatGPT領(lǐng)域。
小型科技公司正在跟風(fēng)熱度,,大型公司也并非輕松控制ChatGPT,。比如谷歌Bard發(fā)布時(shí),,演示視頻中犯了一個(gè)事實(shí)錯(cuò)誤,導(dǎo)致谷歌股價(jià)大跌,,目前市值已經(jīng)下降了1700億美元,。
1.扎堆入局ChatGPT競(jìng)賽
在搜索和AI領(lǐng)域積累最深的百度,自然被市場(chǎng)寄予厚望,。
百度,,作為在搜索和AI領(lǐng)域積累最深的公司,在市場(chǎng)上擁有很高的期望,。計(jì)劃在今年三月推出一款類(lèi)似于ChatGPT的人工智能聊天機(jī)器人服務(wù),,名為“文心一言”,英文名為ERNIE Bot,。在內(nèi)測(cè)完成后,,將向公眾開(kāi)放。不同的是,,該工具將初始版本內(nèi)嵌入搜索服務(wù)中,,允許用戶(hù)通過(guò)對(duì)話(huà)式方式獲得搜索結(jié)果。
百度的CEO李彥宏在去年9月判斷人工智能的發(fā)展將有“技術(shù)層面和商業(yè)應(yīng)用層面的方向性改變”,。盡管沒(méi)有首先推出ChatGPT,,但百度具備了人工智能所需的算力、算法和數(shù)據(jù),,在芯片,、框架、模型和應(yīng)用四個(gè)技術(shù)方面都有布局,,是國(guó)內(nèi)少數(shù)擁有全棧AI能力的公司,。
相比百度的技術(shù)研發(fā)儲(chǔ)備,阿里和字節(jié)跳動(dòng)可能是另外兩個(gè)較早布局的玩家,。
2月9日,,阿里的達(dá)摩院版ChatGPT在內(nèi)測(cè)中預(yù)先曝光。該新產(chǎn)品具備多種功能,,包括知識(shí)問(wèn)答,、人工智能繪畫(huà)、代碼生成,、小說(shuō)續(xù)寫(xiě),、文案撰寫(xiě)和寫(xiě)詩(shī)作詞等。在人工問(wèn)答的水平方面,,達(dá)摩院版ChatGPT已經(jīng)實(shí)現(xiàn)了相對(duì)真實(shí)的回答,,同時(shí)也能實(shí)現(xiàn)多輪問(wèn)答。
實(shí)際上,,在2022年5月,,阿里公布了相應(yīng)的能力,,在AIGC方面,隨著超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的發(fā)布,,生成的實(shí)景圖片已經(jīng)非常逼真,。
阿里現(xiàn)已推出了M6芯片,支持十萬(wàn)億的模型參數(shù)規(guī)模,,平均單卡可承載200億參數(shù),,同等參數(shù)規(guī)模能耗僅為前業(yè)界標(biāo)桿的1%,大大降低了大模型訓(xùn)練的門(mén)檻,。
字節(jié)動(dòng)態(tài)正在研發(fā)ChatGPT,,雖然全棧技術(shù)不是非常出色,但在商業(yè)應(yīng)用方面有很大的前瞻性,。字節(jié)動(dòng)態(tài)從去年開(kāi)始研發(fā)類(lèi)ChatGPT項(xiàng)目,,現(xiàn)在已經(jīng)在內(nèi)部上線(xiàn)了測(cè)試插件,由AI實(shí)驗(yàn)室主導(dǎo),,還在探索當(dāng)中,。此外,字節(jié)動(dòng)態(tài)的AML團(tuán)隊(duì)也開(kāi)發(fā)了veGiantModel模型,,類(lèi)似于為ChatGPT提供支持的GPT-3.5系列模型,。
字節(jié)動(dòng)態(tài)早就著手研究基于GPT2和GPT3的訓(xùn)練模型和產(chǎn)品,在NLP領(lǐng)域也有許多研究積累,。目前,,字節(jié)動(dòng)態(tài)在對(duì)話(huà)機(jī)器人、機(jī)器翻譯,、機(jī)器寫(xiě)作方面有多項(xiàng)研究,,特別是內(nèi)容創(chuàng)作方面。在ChatGPT用于寫(xiě)文章之前,,字節(jié)動(dòng)態(tài)就研發(fā)了Xiaomingbot自動(dòng)寫(xiě)稿平臺(tái),,從2016年上線(xiàn)以來(lái),已經(jīng)寫(xiě)了60萬(wàn)篇文章,,覆蓋了17場(chǎng)體育賽事,,支持6種語(yǔ)言。
近日,,快手也宣布正在大力研究大型語(yǔ)言模型(LLM),,并已經(jīng)啟動(dòng)了相關(guān)項(xiàng)目,涵蓋了LLM模型的訓(xùn)練,、文字自動(dòng)創(chuàng)作和生成,、對(duì)話(huà)系統(tǒng)的開(kāi)發(fā)等領(lǐng)域,。
另外,,京東云的言犀也宣布將推出工業(yè)版的ChatGPT:ChatJD,,其參數(shù)量預(yù)計(jì)為千億級(jí)別,主要應(yīng)用于零售和金融兩個(gè)領(lǐng)域,。
2.國(guó)內(nèi)大廠為何沒(méi)能搶得先機(jī),?
近幾年,大量的大公司和研究機(jī)構(gòu)加入了人工智能領(lǐng)域,,但真正有實(shí)力的玩家并不多,。估測(cè)訓(xùn)練1750億參數(shù)的GPT-3語(yǔ)言模型需要上萬(wàn)個(gè)CPU/GPU,持續(xù)輸入數(shù)據(jù)24小時(shí),,而且一次運(yùn)算就需要450萬(wàn)美元,,能耗相當(dāng)于開(kāi)車(chē)往返地球和月球。因此,,主流的大型語(yǔ)言模型只能被大型科技公司和少數(shù)研究機(jī)構(gòu)掌握,。
從參數(shù)數(shù)量上看,國(guó)內(nèi)百度的文心模型有2600億參數(shù),,高于GPT-3的1700億參數(shù),,但參數(shù)數(shù)量不能代表模型的效果。國(guó)內(nèi)公司如百度和字節(jié)跳動(dòng)擁有大量數(shù)據(jù)積累,,但數(shù)據(jù)清洗,、標(biāo)注、模型設(shè)計(jì),、訓(xùn)練和推理等需要時(shí)間積累,,這可能是國(guó)內(nèi)模型效果不如國(guó)外的重要原因。
關(guān)鍵時(shí)間點(diǎn)是2020年年中,,GPT3.0剛剛推出,。據(jù)流傳的專(zhuān)家紀(jì)要,很多人認(rèn)為GPT3.0不僅代表了技術(shù),,也是人工智能模型發(fā)展的新理念,,因?yàn)殚_(kāi)發(fā)商O(píng)penAI對(duì)此具有獨(dú)到的見(jiàn)解,領(lǐng)先于國(guó)外的Google,,國(guó)內(nèi)公司比OpenAI晚了兩年,。
許多科技企業(yè)認(rèn)為,ChatGPT并不是一種革命性的技術(shù),。它是OpenAI對(duì)GPT-3模型進(jìn)行微調(diào)后開(kāi)發(fā)出的對(duì)話(huà)機(jī)器人,,并未實(shí)現(xiàn)底層模型的重大突破,只是通過(guò)理解,、生成和交些相結(jié)合的方式,,基于人類(lèi)反饋進(jìn)行強(qiáng)化訓(xùn)練,從而帶給人們智能的體驗(yàn)感。
Meta首席人工智能科學(xué)家Yann LeCun也曾表達(dá)過(guò)對(duì)ChatGPT的看法,,他認(rèn)為它并沒(méi)有什么特別的創(chuàng)新,,許多研究實(shí)驗(yàn)室都在使用同樣的技術(shù)。
很多互聯(lián)網(wǎng)企業(yè)沒(méi)有意識(shí)到ChatGPT對(duì)現(xiàn)有搜索模式的顛覆,,也沒(méi)有準(zhǔn)確預(yù)測(cè)到ChatGPT對(duì)腦力勞動(dòng)者產(chǎn)生替代的關(guān)系,。他們認(rèn)為“聊天”只是一種淺層的應(yīng)用,僅僅是一個(gè)更強(qiáng)的聊天機(jī)器人,,現(xiàn)階段并不能看到其商業(yè)的潛力,。
同樣的觀點(diǎn)還包括字節(jié)的NPL算法工程師,他認(rèn)為ChatGPT是一個(gè)不確定性極高的項(xiàng)目,,國(guó)內(nèi)尚未有成功的先例,。如果決定全力以赴,很難獲得資源支持,,更別說(shuō)提高優(yōu)先級(jí)了,。因?yàn)閲?guó)內(nèi)的技術(shù)能力有限,缺少人力,、資金和基礎(chǔ)模型,,對(duì)于互聯(lián)網(wǎng)大廠這種商業(yè)公司而言,有著較大的難度,。
造成的結(jié)果表現(xiàn)在不僅認(rèn)知層面存在局限,,在技術(shù)上也有所局限。ChatGPT 的信息截至 2021 年,,這意味著它無(wú)法提供實(shí)時(shí)信息?,F(xiàn)在,百度正在努力解決信息實(shí)時(shí)性問(wèn)題,。與此同時(shí),,ChatGPT 已經(jīng)在準(zhǔn)備推出基于 GPT-4 的新產(chǎn)品,國(guó)內(nèi)企業(yè)也有了新的目標(biāo)需要實(shí)現(xiàn),。
3.跟風(fēng)熱潮中,,誰(shuí)在硬蹭熱點(diǎn)?
前阿里云大模型負(fù)責(zé)人楊紅霞評(píng)論了目前互聯(lián)網(wǎng)公司熱衷于做ChatGPT的現(xiàn)狀,。她表示:“僅有參數(shù)規(guī)模達(dá)到100B以上的大模型才有足夠的實(shí)力來(lái)提供高質(zhì)量的對(duì)話(huà)回答,。”
根據(jù)這個(gè)標(biāo)準(zhǔn),,百度的飛槳平臺(tái)和文心大模型,、阿里的“通義”大模型以及華為的鵬城盤(pán)古大模型都有較高的實(shí)力。而360,、網(wǎng)易有道以及學(xué)而思等企業(yè)目前技術(shù)研發(fā)水平和進(jìn)度較差,,缺乏相應(yīng)的大模型和技術(shù)儲(chǔ)備,。
此外,還有一些企業(yè)被認(rèn)為是跟隨潮流追風(fēng)口,,比如漢王科技,。根據(jù)半年報(bào),該公司相關(guān)的文本大數(shù)據(jù)業(yè)務(wù)營(yíng)收僅占總營(yíng)收的14%,,同比還有下降趨勢(shì)。然而,,該公司卻通過(guò)炒作ChatGPT概念實(shí)現(xiàn)了股價(jià)的暴漲,。
近期,越來(lái)越多的企業(yè)都在積極使用ChatGPT技術(shù)來(lái)提升自身業(yè)務(wù),。然而,,也有一些企業(yè)并沒(méi)有采取任何行動(dòng),但卻受益于ChatGPT熱潮,。2月8日,,微軟推出了集成了ChatGPT技術(shù)的新版必應(yīng),其回答內(nèi)容中不少答案來(lái)自知乎,,該天下午知乎的股價(jià)一度漲幅超過(guò)56%,。由于ChatGPT可能對(duì)社區(qū)問(wèn)答造成深遠(yuǎn)影響,知乎方面一直對(duì)ChatGPT相關(guān)事宜保持沉默,。但市場(chǎng)對(duì)其仍然熱愛(ài),,帶動(dòng)了股價(jià)的增長(zhǎng)。
有業(yè)內(nèi)人士表示,,許多中小型企業(yè)缺乏技術(shù)實(shí)力,,但也可以利用開(kāi)源的Transformer大模型,在一定程度上實(shí)現(xiàn)ChatGPT的功能,。
然而,,達(dá)摩院專(zhuān)家表示,目前大規(guī)模預(yù)訓(xùn)練的基于Transformer的模型雖然能很好地解決感知智能相關(guān)任務(wù),,但由于缺乏精心設(shè)計(jì)的純Transformer模型,,基本無(wú)法實(shí)現(xiàn)認(rèn)知智能。
正如字節(jié)跳動(dòng)的情況,,火山引擎的售前支持人員也表示,,該平臺(tái)尚未推出類(lèi)似產(chǎn)品,但可以通過(guò)機(jī)器學(xué)習(xí)平臺(tái)與自家產(chǎn)品結(jié)合,,經(jīng)過(guò)二次開(kāi)發(fā),,能夠?qū)崿F(xiàn)類(lèi)ChatGPT的效果。
4.尾聲
AIGC尤其是目前的ChatGPT確實(shí)是非常重要的新方向,,不像之前談元宇宙很多人不認(rèn)可,、談28nm落地很多人搖頭,、談國(guó)產(chǎn)操作系統(tǒng)大家尷尬一笑,經(jīng)過(guò)這段時(shí)間發(fā)酵,,和AI相關(guān)的上下游企業(yè)都是非常緊張而且重視的態(tài)度,。
AI產(chǎn)業(yè)的成熟,是大家目前極少數(shù)能看清的,,可以提升整個(gè)社會(huì)生產(chǎn)效率的可落地工具,,也就是很多年不再提升的全要素生產(chǎn)率,能再上一個(gè)臺(tái)階的最大希望(很多人原本期待L4自動(dòng)駕駛會(huì)先落地),,經(jīng)濟(jì)增長(zhǎng)越慢大家才越內(nèi)卷,,AI有可能會(huì)讓經(jīng)濟(jì)增速上一個(gè)臺(tái)階。這個(gè)方向是幾乎不可能被放棄的,,對(duì)于互聯(lián)網(wǎng)頭部企業(yè)而言,,如果這一次的機(jī)遇無(wú)法把握住,那么像新巨頭字節(jié)之前用算法(當(dāng)時(shí)的最新工具)顛覆老巨頭百度這種事情也會(huì)有很大概率再次上演,,這也是各家非常緊張的真實(shí)原因,。
但是實(shí)際來(lái)看,也能理解這里算法,、算力,、數(shù)據(jù)三個(gè)方面的要求都是極高的,所以嚴(yán)格意義上只有巨頭能做,。從事實(shí)出發(fā),,我們不能發(fā)現(xiàn),現(xiàn)在連足夠算力的先進(jìn)制程AI芯片都不夠,,目前大家能想到的妥協(xié)方案是用CPU來(lái)頂,。所以小公司撐不起全譜系A(chǔ)I研發(fā),大概率仍舊是接入端口部署應(yīng)用,,包括最后國(guó)內(nèi)能活下來(lái)的AI平臺(tái),,可能也就是兩至三家;
如果類(lèi)比AI產(chǎn)業(yè)對(duì)于,,就如8年前伊始的新能源汽車(chē),,有兩三年的技術(shù)代差,但是核心技術(shù)沒(méi)有實(shí)質(zhì)性壟斷,、沒(méi)有專(zhuān)利權(quán)鐵桶,、沒(méi)有制造業(yè)上的硬門(mén)檻,目前對(duì)于國(guó)內(nèi)最尷尬的是算力芯片的困局,,但是在其他領(lǐng)域(數(shù)據(jù)源,、人工標(biāo)注、中文語(yǔ)境)是有比較優(yōu)勢(shì)的,,有點(diǎn)像當(dāng)年新能源車(chē)?yán)镂覀冇校▏?guó)內(nèi)市場(chǎng),、人工,、電池、補(bǔ)貼)這些優(yōu)勢(shì)一樣,。希望是靠著補(bǔ)貼,、市場(chǎng)容量、制造業(yè)優(yōu)勢(shì)(這次是數(shù)據(jù)源優(yōu)勢(shì)),,能彎道超車(chē),,起碼不落后。
包括騰訊,、阿里,、字節(jié)、小紅書(shū),、菜鳥(niǎo)等互聯(lián)網(wǎng)公司,,已經(jīng)在NPL算法工程師等相關(guān)招聘崗位中,,加入了從業(yè)者需了解熟悉GPT-3等相關(guān)模型的要求,。而招聘的月薪多在4萬(wàn)元左右,最高可達(dá)10萬(wàn)元,。
2023年,,ChatGPT點(diǎn)燃的這把火,可以淬煉出真金的企業(yè)和人才,,也可以蒸發(fā)掉虛妄的概念,。最后想說(shuō)的是,ChatGPT是開(kāi)胃菜,,GPT4.0才是大餐,。