8月5日消息,在最新發(fā)布的中文多模態(tài)大模型SuperCLUE-V基準(zhǔn)評(píng)測中,騰訊混元大模型獲國內(nèi)排名第一,,穩(wěn)居卓越領(lǐng)導(dǎo)者象限,。
此次評(píng)測聚焦于大模型理解復(fù)雜現(xiàn)實(shí)世界的關(guān)鍵能力,即多模態(tài)理解,,俗稱“圖生文”,。
多模態(tài)理解要求模型能夠準(zhǔn)確識(shí)別圖像元素,理解它們之間的關(guān)系,,并生成自然語言描述,。
這一能力不僅考驗(yàn)圖像識(shí)別的精確度,也體現(xiàn)了對(duì)場景的全面理解,、對(duì)細(xì)節(jié)的深度洞察,,是衡量模型對(duì)復(fù)雜現(xiàn)實(shí)世界理解力的重要標(biāo)準(zhǔn)。
在本次測評(píng)中,,共有12個(gè)國內(nèi)外具有代表性的多模態(tài)理解大模型參與,,騰訊混元大模型在多模態(tài)基礎(chǔ)能力和應(yīng)用能力兩大方向上均展現(xiàn)出顯著優(yōu)勢,獲得總分71.95的高分,。
評(píng)測標(biāo)準(zhǔn)涵蓋了理解準(zhǔn)確性,、回應(yīng)相關(guān)性和推理深度等維度,確保了評(píng)估的科學(xué)性和公正性,。
騰訊混元大模型在基礎(chǔ)能力方面緊追海外頂尖模型,,總成績僅略低于GPT-4o,表現(xiàn)優(yōu)于CLaude3.5-Sonnet和Gemini-1.5-Pro,。
在應(yīng)用能力維度上,,憑借對(duì)中文語境的深刻理解以及在通用、常識(shí),、圖像等多領(lǐng)域的綜合能力,,騰訊混元大模型展現(xiàn)出巨大的實(shí)際應(yīng)用潛力。