《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > 智譜AI推出國產(chǎn)大模型GLM-4

智譜AI推出國產(chǎn)大模型GLM-4

性能比上代提升近60%,,宣稱對(duì)標(biāo)美國GPT-4
2024-01-17
來源:鈦媒體
關(guān)鍵詞: 智譜 AI GLM-4 國產(chǎn)大模型

隨著OpenAI即將推出GPT-5,國內(nèi)人工智能(AI)大模型正加速追趕,。

鈦媒體App 1月16日消息,,阿里,、騰訊投資的 AI 公司智譜 AI 在北京發(fā)布全新自研的第四代多模態(tài)基座大模型GLM-4系列,稱性能相比上一代全面提升接近60%、模型性能直接逼近GPT-4,,“特別是中文能力可比肩GPT-4”,,并且該公司還公布GLMs個(gè)性化智能體模型等產(chǎn)品。

同時(shí),,智譜AI今天還公布一項(xiàng)由智譜聯(lián)合生態(tài)伙伴發(fā)起的大模型創(chuàng)業(yè)基金“Z計(jì)劃”,,總投入10億元人民幣,專門支持大模型原始創(chuàng)新,,覆蓋大模型算法,、底層算子、芯片優(yōu)化,、行業(yè)大模型和超級(jí)應(yīng)用等方向,。

智譜 AI 公司CEO張鵬表示,此次GLM-4的發(fā)布及上線,,是智譜AI大模型研發(fā)上的關(guān)鍵突破,。他強(qiáng)調(diào),為了瞄向AGI,,公司每3-6個(gè)月更新一次做一次升級(jí),,上一代智譜解決的是模型能力矩陣的對(duì)標(biāo),這一次是模型能力上跟GPT-4做到基本對(duì)齊,,“GLM-4的基本能力已經(jīng)比肩GPT-4,。”

2.jpeg

據(jù)悉,,智譜 AI 成立于2019年,,脫胎于清華大學(xué)計(jì)算機(jī)系知識(shí)工程研究室團(tuán)隊(duì),是清華大學(xué)知識(shí)成果轉(zhuǎn)化的創(chuàng)業(yè)公司,,瞄準(zhǔn) AI 大模型研發(fā)落地,,公司CEO張鵬畢業(yè)于清華計(jì)算機(jī)系,,總裁王紹蘭為清華創(chuàng)新領(lǐng)軍博士,,清華大學(xué)計(jì)算系教授唐杰也參與研發(fā)中國最大規(guī)模預(yù)訓(xùn)練模型悟道2.0。

2020年,,智譜AI 開始啟動(dòng)GLM預(yù)訓(xùn)練架構(gòu)的研發(fā),,致力于打造新一代認(rèn)知智能大模型,專注于做大模型的中國創(chuàng)新,,并訓(xùn)練出100億參數(shù)模型GLM-10B,;2021年利用MoE架構(gòu)成功訓(xùn)練出萬億稀疏模型;2022年公布1300億級(jí)超大規(guī)模預(yù)訓(xùn)練通用模型GLM-130B,,并以此打造大模型平臺(tái)及產(chǎn)品矩陣,。

2023年初,智譜AI 推出千億基座的對(duì)話模型ChatGLM,,并開源單卡版模型ChatGLM-6B等,,部署于個(gè)人開發(fā)者和企業(yè)應(yīng)用領(lǐng)域,。6月,智譜發(fā)布ChatGLM2,,包括6B,、130B、12B(120億參數(shù)),、32B,、66B等參數(shù)的模型,推理速度增長42%,。據(jù)張鵬透露,,相比GPT-4版的ChatGPT,ChatGLM2-12B,、32B和66B性能分別提升16%,、36%和280%。

2023年10月,,智譜 AI 公布ChatGLM3-1.5B,、3B和6B(15億、30億,、60億)參數(shù)版本,,在多模態(tài)理解、代碼模塊,、網(wǎng)絡(luò)搜索等能力上有所提升,,而且相對(duì)最佳開源模型推理速度提升2-3倍。同時(shí),,基于集成自研AgentTuning技術(shù),,在智能規(guī)劃和執(zhí)行上比ChatGLM-2提升1000%。另外,,ChatGLM3還利用華為昇騰生態(tài),,使算力推理速度提升3倍以上。同時(shí),,該公司也進(jìn)行商業(yè)化探索,,打造AIGC(生成式 AI)模型及產(chǎn)品矩陣,包括已獲批上線的智譜清言,、高效率代碼模型CodeGeeX等,。

融資方面,創(chuàng)立至今的四年多,,智譜AI 已完成四輪融資,,投資方包括君聯(lián)資本、啟明創(chuàng)投、中科創(chuàng)星,、美團(tuán),、螞蟻、阿里,、騰訊,、小米、金山,、順為,、Boss直聘、好未來,、紅杉,、高瓴等多家機(jī)構(gòu),去年融資額超過25億元人民幣,。目前,,智譜 AI 估值超過百億,是國內(nèi) AI 領(lǐng)域獨(dú)角獸企業(yè),。

公開信息顯示,,截至目前,智譜 AI 開源模型在Hugging Face的全球下載量已超過1100萬次,,GitHub累計(jì)有超過5萬Stars,。

此次,智譜AI首屆技術(shù)開放日(Zhipu DevDay)上,,主要公布三個(gè)重要消息:GLM-4系列多模態(tài)模型的發(fā)布,,上線全新GLM-4的All Tools(所有工具)、GLMs個(gè)性化智能體定制能力,,以及發(fā)起并聯(lián)合成立多個(gè)大模型開源基金,、商業(yè)化進(jìn)展,從而拓寬智譜AI GLM系列模型生態(tài),。

首先是GLM-4系列模型,。具體來說,GLM-4可支持128k的上下文窗口長度,,單次提示詞可以處理的文本可以達(dá)到300頁,。同時(shí),,它的推理速度更快,,支持更高的并發(fā),大大降低推理成本,,而且文生圖和多模態(tài)理解等方面都得到了一定增強(qiáng),。

據(jù)張鵬透露,在支持中文的文字寫作、數(shù)學(xué)計(jì)算,、邏輯推理等AlignBench對(duì)齊能力基準(zhǔn)測(cè)試中,,GLM-4達(dá)到GPT-4的95%-116%的水平;中英文的指令跟隨能力方面,,GLM-4基本能達(dá)到GPT-4的80%左右水平,;在支持總結(jié)、信息抽取,、復(fù)雜推理能力的LongBench基準(zhǔn)測(cè)試中,,GLM-4 128k版本達(dá)到81.1分,超過了GPT-4(71.2),。

3.jpeg

其次,,GLM-4的All Tools是全新的智能體能力展示,可實(shí)現(xiàn)自主根據(jù)用戶意圖,,自動(dòng)理解,、規(guī)劃復(fù)雜指令,能力完全自動(dòng),,自由調(diào)用網(wǎng)頁瀏覽器,、代碼解釋、多模態(tài)文生圖,、文件處理,、數(shù)據(jù)分析、圖表繪制等復(fù)雜任務(wù),;GLMs個(gè)性化智能體定制功能則是支持用戶用簡單的提示詞指令創(chuàng)建屬于自己的GLM智能體,,包括實(shí)現(xiàn)自動(dòng)寫代碼、幫老師設(shè)計(jì)豐富有趣教學(xué)方案的教案設(shè)計(jì)師,,或是能根據(jù)關(guān)鍵詞快速生成Logo的畫師等,。

在會(huì)議現(xiàn)場(chǎng),張鵬同時(shí)預(yù)告,,GLMs 模型應(yīng)用商店開發(fā)者分成計(jì)劃也將同期公布,。

最后是關(guān)于基金和生態(tài)部分,智譜AI共公布了四個(gè)基金項(xiàng)目:一,、其聯(lián)合發(fā)起了CCF-智譜大模型基金,、SMP-智譜大模型交叉學(xué)科基金,去年為全國30余所高校參與的41個(gè)研究項(xiàng)目累計(jì)提供超過1000萬元資金和算力支持,;二,、今年智譜AI還發(fā)起大模型開源基金,提供1000張GPU卡,、1000萬元現(xiàn)金支持,、1000億免費(fèi)API tokens,;三、智譜AI也將“Z計(jì)劃”進(jìn)一步升級(jí),,聯(lián)合生態(tài)伙伴發(fā)起總額10億元基金,,支持大模型創(chuàng)業(yè)項(xiàng)目的創(chuàng)新探索,目前已公開投資了聆心智能,、無問芯穹等項(xiàng)目,。

商業(yè)化層面,目前智譜 AI GLM系列模型與德勤,、火山引擎,、蒙牛、中國電信,、金山軟件,、芒果TV、馬蜂窩,、華泰證券等數(shù)十家公司合作,,應(yīng)用于政務(wù)、金融,、能源,、制造、醫(yī)療等領(lǐng)域,,支持10余種國產(chǎn)硬件生態(tài),。張鵬透露,除了To B端業(yè)務(wù)落地,,未來智譜 AI 還將做To C端超級(jí)應(yīng)用,,目的要把閉環(huán)做起來,給未來也留下一個(gè)可能性,。

鈦媒體App了解到,,目前智譜 AI 主要銷售三類技術(shù)服務(wù):數(shù)字人SaaS/PaaS方案,科技情報(bào)SaaS/PaaS方案,,以及包括ChatGLM系列在內(nèi)的認(rèn)知大模型PaaS/MaaS平臺(tái)方案,。

張鵬對(duì)外透露,2023年下半年,,公司簽單客戶約有幾百家,,2023年整體有億級(jí)簽單額。

對(duì)于中國大模型與GPT的差距,,據(jù)騰訊新聞深網(wǎng),,張鵬表示,目前兩者還處于追趕,、縮小差距態(tài)勢(shì),,主要是國產(chǎn)大模型起步比OpenAI晚,因此需要不斷積累去調(diào)整發(fā)展速度,、曲線的斜率,,只有算法、系統(tǒng)工程,、數(shù)據(jù),、應(yīng)用到落地等鏈條所有的創(chuàng)新累加起來,才有可能去超越GPT,。

此前張鵬曾表示,,在規(guī)模和核心能力上,國內(nèi)研發(fā)的大模型與世界先進(jìn)水平差距約一年左右,。

中國科學(xué)院院士,、清華大學(xué)教授張鈸卻認(rèn)為,大語言模型(LLM)仍存在不自知,、質(zhì)量不可控,、不可信、不魯棒(受提示詞影響)等問題,,“幻覺”錯(cuò)誤也很多,。然而,盡管如此,,但他卻依然支持大模型技術(shù)發(fā)展,,他認(rèn)為 AI 產(chǎn)業(yè)發(fā)展一直受制于特定領(lǐng)域、特定模型和特定任務(wù)的限制,,難以做大做強(qiáng),,因此發(fā)展比較緩慢,而大模型給行業(yè)提供了發(fā)展通用硬件和軟件的更多機(jī)會(huì),。

“我想經(jīng)過2023年的充分競(jìng)爭,,現(xiàn)在我們逐漸可以說進(jìn)入一個(gè)決戰(zhàn)時(shí)刻了?!睆堸i表示,,智譜 AI 將希望與 AI 行業(yè)所有的參與者、產(chǎn)業(yè)鏈上下游合作伙伴,、開發(fā)者社區(qū),、學(xué)術(shù)界一同努力,為中國 AI 未來發(fā)展貢獻(xiàn)綿薄之力,。

weidian.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章,、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容,、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118,;郵箱:[email protected],。