深燃(shenrancaijing)原創(chuàng)
作者 | 王敏
編輯 | 金玙璠
一夜之間,,AI大模型熱得發(fā)燙。
繼3月中旬,,百度最先下場,,以“文心一言”搶占了對標(biāo)ChatGPT的“國內(nèi)第一”后,,過去一個月,,大模型一直是市場的焦點(diǎn)。尤其是在過去一周里,,各界選手紛紛“大干快上”,,密集開“卷”,要么直接卷大模型,,要么卷產(chǎn)品卷Demo,,要么卷預(yù)告卷進(jìn)展??傊?,大模型江湖,徹底火起來了,。
百度最先挑起戰(zhàn)事,,阿里、商湯跟得最緊,、跑得最猛,,都已發(fā)布類ChatGPT產(chǎn)品,。
不止如此,科大訊飛等中大廠的大模型也已經(jīng)在發(fā)布的路上,。而適配到具體場景的應(yīng)用和產(chǎn)品,,比如360的“360智腦”已經(jīng)進(jìn)行過現(xiàn)場演示,有贊也帶來了由大模型驅(qū)動的首個AI產(chǎn)品“加我智能”,。就連飛書,,也悄悄上線了關(guān)于智能助手“My AI”的Demo視頻。
就在去年,,AI還因?yàn)樯虡I(yè)化困局而被外界詬病,。去年年底,OpenAI的ChatGPT問世,,成為了攪動AI大模型江湖的鯰魚,,一時間,各類選手紛紛涌了進(jìn)來,。
被視為是移動互聯(lián)網(wǎng)時代第一場大戰(zhàn)的“千團(tuán)大戰(zhàn)”,,至今仍令人記憶猶新,那時,,從業(yè)者們的信念是,,所有的行業(yè)都值得用互聯(lián)網(wǎng)再做一遍。時至今日,,阿里巴巴集團(tuán)董事會主席兼CEO張勇在4月11日已經(jīng)喊出“所有產(chǎn)品都值得用大模型重做一遍”的口號,。盡管當(dāng)下還處于大模型混戰(zhàn)的早期階段,各家的能力更新,,都還沒有正式對外開放,,對于大廠的大模型能力,還沒有一套成熟的評估體系,,但是,,AI大模型時代的變革,已經(jīng)開始醞釀,。
市場各種信號都昭示著,,“百模大戰(zhàn)”的帷幕已經(jīng)拉開。曾經(jīng),,硝煙彌漫的“千團(tuán)大戰(zhàn)”,,結(jié)局是一地雞毛,數(shù)千家公司同臺競技,,只有美團(tuán)最終跑了出來,,無數(shù)公司淪為炮灰。現(xiàn)如今,AI時代的“百模大戰(zhàn)”,,“入場券”更貴,,對于資源、技術(shù),、人才的要求更高,,也更需要耐心和時間。新選手燒錢燒時間,,結(jié)果也可能只是巨頭的陪跑,。這場持久戰(zhàn),才剛剛開始,。
百“?!贝髴?zhàn),一觸即發(fā)
大模型江湖混戰(zhàn),,愈演愈烈,,下場的選手越來越多。競爭最激烈也最受關(guān)注的,,便是在大模型領(lǐng)域有所積累的互聯(lián)網(wǎng)巨頭選手們,。
這波混戰(zhàn)源起ChatGPT。巨頭選手們的類ChatGPT產(chǎn)品以及最新的AI大語言模型首先受到關(guān)注,。其中,,百度3月16日發(fā)布了“文心一言”;阿里的“通義千問”已從4月7日開始企業(yè)內(nèi)測,;商湯科技在4月10日的技術(shù)交流會上帶來了“商量SenseChat”,,目前還未對外開放;360在3月29日現(xiàn)場演示了“360智腦”后,,也將于4月16日開啟企業(yè)內(nèi)測,。
這些類ChatGPT產(chǎn)品,主打的都是對話問答,、文本及代碼等生成能力,,外界常常會把多輪對話、數(shù)學(xué)能力,、編碼能力作為測評的標(biāo)準(zhǔn)。
業(yè)界的共識是,,國內(nèi)這些產(chǎn)品相較ChatGPT,,還有一定的差距。但是這些產(chǎn)品,,究竟孰強(qiáng)孰弱,、孰優(yōu)孰劣,還難下定論,因?yàn)樯刑幱趦?nèi)測或演示階段,。
不過,,各家的產(chǎn)品形態(tài)有一定差別。比如,,盡管文心一言的生成圖片能力遭到吐槽,,但已經(jīng)實(shí)現(xiàn)了多模態(tài)交互;通義千問增加了“百寶袋”,,把寫提綱,、SWOT分析等能力單獨(dú)列成板塊以供使用;360則是直接和搜索引擎場景進(jìn)行了結(jié)合,。
與類ChatGPT產(chǎn)品共同進(jìn)入我們視野的,,則是各家的大模型體系。
其中,,360的大模型,,此前市場關(guān)注度并不算高。不過,,360稱,,其人工智能研究院從2020年開始,一直在對包括類ChatGPT在內(nèi)的大模型通用人工智能技術(shù)持續(xù)投入,。
其余三家中,,百度“文心一言”和阿里的“通義千問”,背后分別是此前已經(jīng)發(fā)布過的文心大模型體系和通義大模型體系,;商湯“商量SenseChat”背后是最新問世的“日日新SenseNova”大模型體系,。三家本質(zhì)都是在統(tǒng)一AI底座的基礎(chǔ)上,在通用模型層覆蓋NLP,、視覺等領(lǐng)域,,再進(jìn)行行業(yè)模型和場景模型的孵化。
文心大模型除了有文心一言,、AI作畫應(yīng)用文心一格外,,還和工業(yè)、能源,、金融等多個行業(yè)客戶共同打造了11個行業(yè)大模型,。商湯基于大模型體系,還發(fā)布了AI內(nèi)容創(chuàng)作社區(qū)平臺“秒畫”,、AI數(shù)字人視頻生成平臺“如影”,、3D內(nèi)容生成平臺“瓊宇”、“格物”,。
接下來,,預(yù)計(jì)最快亮相的選手,,當(dāng)屬科大訊飛。其計(jì)劃于5月6日發(fā)布“1+N認(rèn)知智能大模型”,,“1”是底座平臺,,“N”則是應(yīng)用于多個行業(yè)領(lǐng)域的專用大模型版本,同時,,“N”個場景的示范性應(yīng)用產(chǎn)品也將隨之呈現(xiàn),。但是否會有類ChatGPT產(chǎn)品,還不確定,。
備受市場期待的選手,,還有華為、騰訊,、京東,、字節(jié)跳動,這幾家雖然沒有大張旗鼓發(fā)布基于大語言模型的新產(chǎn)品,,但也找機(jī)會對外重新梳理大模型體系或透露新進(jìn)展,。
其中,華為云首席科學(xué)家田奇在4月8日的一場公開活動上表示,,華為盤古大模型在2022年發(fā)布NLP大模型,、CV大模型和科學(xué)計(jì)算三個基礎(chǔ)大模型之后,又陸續(xù)發(fā)布行業(yè)大模型系列,,包括盤古氣象大模型,、藥物分子大模型等等,華為大模型還是堅(jiān)定走To B的路線,。其內(nèi)部專家此前就曾指出,,“華為很少在新的趨勢出現(xiàn)后,立馬追上”,。
騰訊曾于2022年發(fā)布混元大模型體系,,據(jù)透露,目前也在研發(fā)類ChatGPT產(chǎn)品,;京東4月對外宣稱,,計(jì)劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”;字節(jié)跳動根據(jù)公開報道正分別在語言和圖像兩種模態(tài)上發(fā)力,。
當(dāng)然,,市場上也不乏蹭熱點(diǎn)的選手。昆侖萬維的大語言模型“天工”3.5,,也將于4月17日開啟內(nèi)測,。4月11日,深交所向昆侖萬維下發(fā)關(guān)注函,,再次提醒不得利用市場熱點(diǎn)題材,,進(jìn)行“蹭熱點(diǎn)”等違法違規(guī)行為。
除了這些大公司之外,,根據(jù)民生證券相關(guān)研報統(tǒng)計(jì),,目前國內(nèi)至少已經(jīng)有30多家大模型亮相,其中不乏參數(shù)規(guī)模甚至超過ChatGPT規(guī)模的大模型,。廠商涵蓋了互聯(lián)網(wǎng)巨頭,、AI上市公司、服務(wù)器龍頭企業(yè),、科研院所與一級市場創(chuàng)業(yè)公司,。
大模型應(yīng)接不暇,新產(chǎn)品層出不窮,,ChatGPT風(fēng)口上的諸神混戰(zhàn)才剛剛開始,。
搶發(fā)大模型,大廠不能錯過的一戰(zhàn)
大廠混戰(zhàn)大模型之際,,各家的大模型能力究竟幾何,,才是最令外界好奇的。以往,,大廠選手們做大模型,,總是粗暴地拼參數(shù)量,業(yè)內(nèi)大模型的參數(shù)從百億進(jìn)化到了千億甚至萬億,。
現(xiàn)如今,,參數(shù)量早已不能當(dāng)作衡量大模型能力的唯一標(biāo)準(zhǔn)。AI領(lǐng)域從業(yè)者章容對深燃表示,,大模型的能力或許有學(xué)術(shù)層面的評估,,但依然缺乏較為成熟的評估標(biāo)準(zhǔn)和體系。
文心一言發(fā)布后,,百度創(chuàng)始人李彥宏在3月下旬曾對外表示,,文心一言不如最新的ChatGPT版本,但是差距不是很大,,可能就是一兩個月的差別,。就連剛剛下場成立AI公司“百川智能”的搜狗創(chuàng)始人王小川也對外表示,正在研發(fā)大模型產(chǎn)品,,今年內(nèi)可能就能追上ChatGPT3.5的水平,,至于趕上GPT-4或者GPT-5,可能需要3年左右的時間,。
現(xiàn)如今,,業(yè)界衡量大模型能力最直接的標(biāo)準(zhǔn),似乎變成了和ChatGPT相比差距有多大,,多久能追上,,但也只能是模糊對比,。
雖然如何評價大模型的實(shí)力還沒有統(tǒng)一標(biāo)準(zhǔn)。但是,,大廠們已經(jīng)開始展望大模型進(jìn)入到業(yè)務(wù)應(yīng)用層能帶來的變革,。從目前選手們的參與思路來看,百度,、阿里都已經(jīng)宣布未來主流業(yè)務(wù),,將與最新的大語言模型深度結(jié)合。
在文心一言發(fā)布前,,李彥宏在內(nèi)部信中就曾介紹,,百度計(jì)劃將搜索、智能云,、自動駕駛多項(xiàng)主力業(yè)務(wù)與文心一言整合,。4月11日的阿里云峰會上,張勇也表示,,阿里巴巴所有產(chǎn)品,,包括天貓、釘釘,、高德地圖,、淘寶、優(yōu)酷,、盒馬等,,未來都將接入“通義千問”大模型進(jìn)行改造。目前釘釘和天貓精靈已經(jīng)接入測試,,新功能將在評估之后發(fā)布,。
大廠主流業(yè)務(wù)的改造正在醞釀或進(jìn)行。而大廠掌握著更多的場景和數(shù)據(jù),,也能反哺大模型的發(fā)展,。
在云計(jì)算領(lǐng)域,2022年,,以天翼云為代表的運(yùn)營商云加速崛起,,而以阿里、騰訊為代表的互聯(lián)網(wǎng)大廠云計(jì)算業(yè)務(wù)增速放緩,,大廠云需要找到新的增長驅(qū)動力,,張勇甚至下場擔(dān)任阿里云事業(yè)部的一把手。
顯然,,大模型正在扮演這樣的角色,。百度、阿里,、華為,,都是云事業(yè)部來做大模型to B,、to G的對外服務(wù),云計(jì)算市場頭部四朵云已經(jīng)集齊三朵,。在大模型時代,,正如李彥宏所言,,云計(jì)算市場的游戲規(guī)則正在發(fā)生根本性變化,。
企業(yè)協(xié)同辦公市場中,疫情以來,,釘釘,、飛書、企業(yè)微信三足鼎立的格局基本形成,。而釘釘在4月11日展示了接入“通義千問”的Demo之后,,飛書在當(dāng)天下午也緊急發(fā)布了智能助手“My AI”的Demo視頻。就如同微軟Office 365的Copilot產(chǎn)品,,釘釘和飛書的Demo,,都或?qū)椭殘鋈嗽诠ぷ餍史矫鎸?shí)現(xiàn)大幅提升。現(xiàn)在,,壓力給到了企業(yè)微信,。
在搜索領(lǐng)域占市場六成份額的百度,要讓文心一言改造搜索體驗(yàn),。占據(jù)搜索市場三成份額的360緊隨其后演示360智腦,,被外界認(rèn)為是,開啟了搜索市場爭奪戰(zhàn),。
同樣,,商湯、科大訊飛這些曾經(jīng)的AI大廠,,見證了從機(jī)器學(xué)習(xí)到AI大模型時代的變遷,,現(xiàn)如今,更是不愿錯過大模型的風(fēng)口,。
擁抱大模型,,就是擁抱下一個時代。大模型內(nèi)卷之際,,結(jié)合場景,,基于大模型的產(chǎn)品依然在層出不窮。比如有贊接入GPT-4,,上線了“加我智能”,。同花順的AI產(chǎn)品將在4月14日上線,但是否會在其i問財(cái)產(chǎn)品的基礎(chǔ)上有所創(chuàng)新,,還未可知,。
“讓子彈先飛半年”
“大廠們都是先來占位,!”章容稱,“因?yàn)榇竽P偷哪芰€遠(yuǎn)未成熟落地,,現(xiàn)在互聯(lián)網(wǎng)大廠更像是在秀肌肉”,。
一位即將進(jìn)行AIGC創(chuàng)業(yè)的AI從業(yè)者告訴深燃,大模型就像是AI時代的操作系統(tǒng),,大廠搶先占位,,不排除是為了搶客戶、搶人才,。畢竟,,大佬們下場官宣創(chuàng)業(yè),往往伴隨著招人,。
但更值得注意的是,,大模型的能力越強(qiáng),API可以實(shí)現(xiàn)的應(yīng)用端場景就越豐富,,相當(dāng)于大廠都在爭AI時代的“App Store”,。
大模型并非一朝一夕就能夠煉造的,現(xiàn)如今大廠選手大模型動態(tài)層出不窮,,本質(zhì)還是過去幾年技術(shù)積累的產(chǎn)物,。
做大模型,必然伴隨著重投入,。在國外,,微軟投資OpenAI,先后投資了超100億美元,,而OpenAI對于GPT-3的訓(xùn)練費(fèi)用已經(jīng)超過1200萬美元,。這一點(diǎn),從國內(nèi)大廠的研發(fā)投入也可窺一斑,。
財(cái)報顯示,,2022年百度的核心研發(fā)費(fèi)用為214.16億元,占百度核心收入比例達(dá)到22.4%,。過去10年,,百度研發(fā)投入超1000億元。根據(jù)商湯財(cái)報,,過去四年,,商湯總營收為149.8億元,而研發(fā)開支則達(dá)到了114.3億元,,營收占比達(dá)到76.3%,。
或許也是因?yàn)槿绱酥氐耐度耄瑢τ诖竽P皖I(lǐng)域內(nèi)卷加劇,業(yè)界出現(xiàn)一種討論,,國外已經(jīng)跑出了GPT-4,,面對如此大的差距,國內(nèi)新選手現(xiàn)在殺入戰(zhàn)場做大模型,,意義大不大,,會不會造成人才和資源的浪費(fèi)。
2023年以來,,多位大佬宣布下場進(jìn)行大模型創(chuàng)業(yè),,但是一部分人的思路已經(jīng)開始調(diào)整。出門問問創(chuàng)始人李志飛最近多次對外表示,,做大模型不能過于樂觀,,貿(mào)然進(jìn)入難度很大,而且競爭激烈,。他的思路已經(jīng)從開始的做通用型大模型,轉(zhuǎn)向更注重結(jié)合自身業(yè)務(wù)場景,,做垂直整合大模型,。
他認(rèn)為,國內(nèi)在1-2年之后,,將會有50家以上的公司擁有自己的大模型,。包括互聯(lián)網(wǎng)大廠自研、中型互聯(lián)網(wǎng)公司基于開源大模型微調(diào),、一些AI公司及垂直領(lǐng)域的甲方,,都會有大模型,市場大模型的供給一定不會太少,。
也有很多業(yè)界人士認(rèn)為,,未來大模型的發(fā)展,將會是頭部幾家寡頭之間的競爭,。
但是,,中國必須做自己的大模型,已是共識,。出現(xiàn)分歧,,本質(zhì)上還是因?yàn)椋竽P偷镊閼?zhàn)才剛剛開始,。
民生證券相關(guān)研報指出,,目前表面上大模型百花齊放,不再稀缺,,是因?yàn)殚_源基礎(chǔ)以及大公司本身的算力儲備與資金實(shí)力,,單純發(fā)布一個大模型門檻,沒有市場想象那么高。但是能夠擁有高質(zhì)量數(shù)據(jù)場景,,才能持續(xù)迭代,,性能逐步逼近ChatGPT的大模型,預(yù)計(jì)最終仍是“鳳毛麟角”,。市場會逐步凝結(jié)共識:得數(shù)據(jù)者得天下,,數(shù)據(jù)成為大模型差異化競爭的關(guān)鍵。
算力,、算法,、數(shù)據(jù)是AI大模型研發(fā)的三大要素。大廠云們在算力上擁有一定優(yōu)勢,。AI領(lǐng)域從業(yè)者貝科對深燃表示,,華為布局昇騰芯片、昇騰生態(tài)已經(jīng)多年,,而且在各地也投資了算力中心,,現(xiàn)如今也已經(jīng)有了一定量的算力儲備。阿里整個集團(tuán)在GPU算力上也有一定儲備,。但這并不意味著大模型能力一定能持續(xù)攀升,。
章容認(rèn)為,大模型將帶來生產(chǎn)力的變革,,已經(jīng)是毋庸置疑的事實(shí),,但是,即便是國外跑得最快的OpenAI以及微軟,,目前在商業(yè)化落地上已經(jīng)有所進(jìn)展,,但也依然不能說成熟穩(wěn)定。至于國內(nèi)大廠的大模型,,目前更是還處于非常早期的階段,。
一方面,生成式人工智能的信息安全問題已經(jīng)顯現(xiàn),。4月11日,,國家互聯(lián)網(wǎng)信息辦公室發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,強(qiáng)調(diào)了生成內(nèi)容的真實(shí)性,,并且提出了相應(yīng)的容錯率和懲罰措施,。
另一方面,當(dāng)前國內(nèi)市場上最新的大模型產(chǎn)品,,無論是面向C端的體驗(yàn)產(chǎn)品,,還是面向企業(yè)的接口,基本都處于內(nèi)測階段,,還沒有真正放開,。
按照目前的形勢,,章容認(rèn)為,當(dāng)前大模型從發(fā)布走向到企業(yè)端,,摸索如何真正提升生產(chǎn)力,,至少需要半年的時間。
本文經(jīng)深燃團(tuán)隊(duì)授權(quán)轉(zhuǎn)載,,如需轉(zhuǎn)載請至深燃公眾號申請授權(quán),。
更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<