谷歌推“最全能”AI模型Gemini正面硬扛GPT-4-AET-電子技術應用

谷歌推“最全能”AI模型Gemini正面硬扛GPT-4

手機、云、數(shù)據中心都可應用的超級全能AI模型

日期： 2023-12-07

來源：華爾街見聞

關鍵詞： 谷歌 Gemini GPT-4

美東時間12月6日周三，谷歌正式向公眾發(fā)布新一代大語言模型（LLM）Gemini，號稱谷歌迄今為止“最大、也最全能的AI模型”，有高級推理能力，回答難題時“考慮得更仔細”。有別于其他公司LLM競品的是，谷歌強調Gemeni是最靈活的模型，因為它用不同大小的版本，可以適用于各種生成式AI應用。

　　其中，最輕盈的版本Gemni Nano可以直接在智能手機上離線運行；相對而言更強大的版本Gemini Pro可以執(zhí)行多種任務，將通過谷歌的類ChatGPT聊天機器人Bard，為眾多谷歌AI 服務提供支持，加持谷歌的Gmail、Maps Docs和YouTube等服務；功能最強大的版本Gemini Ultra也是谷歌迄今打造的最強大LLM，主要為數(shù)據中心和企業(yè)應用而設計。

　　谷歌旗下AI研究機構DeepMind的產品副總裁Eli Collins稱，Gemini的多樣性意味著，它“能夠在從移動設備到大型數(shù)據中心的所有設備上運行。”他表示，谷歌早就希望打造的新一代AI模型更像是樂于助人的合作者，而不是一種智能的軟件，Gemini讓谷歌距離這種遠景又近了一步。

　　32種行業(yè)指標測試中 Gemini有30種遙遙領先GPT-4

現(xiàn)在Gemini只有英語版，谷歌將很快推出其他語言的版本。谷歌CEO Sundar Pichai說，Gemini代表了AI的新時代。最終，Gemini將與谷歌的搜索引擎、廣告產品、Chrome瀏覽器等更多產品結合。

　　Gemini Nano手機電腦版周三可用 Gemini Pro支持Bard、下周面向云客戶 Gemini Ultra明年推行

　　具體應用時間表方面，從本周三起，安卓系統(tǒng)開發(fā)人員可以注冊使用Gemini Nano版，打造智能手機和電腦的Gemini支持App。谷歌稱，Gemini可以立即在其旗艦手機Pixel 8 Pro上啟用，實現(xiàn)諸如歸納電話錄音對話要點等新的生成式AI功能。

　　Gemini Pro版從本周三開始支持Bard，實現(xiàn)高級的推理、規(guī)劃、理解等功能，在170個國家地區(qū)以英語一種語言操作運行，可能不包括英國或者其他歐洲地區(qū)，因為谷歌稱在和當?shù)氐谋O(jiān)管機構合作。

　　從12月13日下周三開始，谷歌將通過谷歌云，在旗下Vertex AI 和 AI Studio平臺向云客戶提供 Gemini Pro版。

　　Gemini Ultra將首先面向開發(fā)者和企業(yè)客戶開放，該版本的應用詳情將在下周公布。谷歌計劃，明年初，向公眾大范圍開放Gemini Ultra應用。

　　谷歌還計劃，明年初發(fā)布Gemini Ultra支持的進階版Bard Advanced，在面向大眾推出以前，先將推出一個測試項目，以便改進Bard Advanced。

　　谷歌的下圖展示了Gemini家族三個版本。

　　谷歌此次毫不諱言和GPT-4一較高低的雄心。發(fā)布Gemini前，谷歌對它進行了一系列以標準行業(yè)指標評估的測試。谷歌稱，在八項測試中，Gemini Pro有六項的表現(xiàn)優(yōu)于OpenAI 的 GPT-3.5。在通用語言理解、推理、數(shù)學和編碼方面測試中，八項基準指標里，Gemini 有七項超過了OpenAI 的最新版模型 GPT-4。

　　同時，谷歌評估了旗下可以解釋和生成代碼的最新生成式AI產品AlphaCode 2，發(fā)現(xiàn)在競爭性編程領域，它領先85%的競爭對手。

　　DeepMind的CEO Demis Hassabis稱，谷歌運行了32種完善的基準指標相關測試，對比Gemini和GPT-4這兩個模型，既有諸如多任務語言理解這類廣泛的整體測試，到生成Python代碼這種單一能力的測試。32種基準指標種，Gemini有30項都“遙遙領先”。

　　以下谷歌報告的截圖可見，在多選問題、數(shù)學問題、Python代碼任務、閱讀等方面，Gemini Pro和Ultra與GPT-4、GPT-3.5等其他LLM的評分對比。

　　Gemini為原生多模態(tài)模型在谷歌更高性能云芯片TPU v5p訓練

　　谷歌稱，Gemini是一種“原生多模態(tài)”AI模型。這意味著它從一開始就經過預先訓練，可以處理用戶基于文本和圖像的提示詞任務，支持文本和圖像的服務。比如家長可以通過上傳數(shù)學問題的圖像，以及在工作表里嘗試解決問題的照片，幫助孩子做家庭作業(yè)。Gemini還能閱讀答案，理解為何是對的、為何是錯的，并解釋需要進一步說明的概念。

　　谷歌稱，谷歌搜索運用生成式AI技術的“搜索生成式體驗”在明年融入和Gemini的新功能。

　　谷歌承認，Gemini仍然可能存在AI產生的虛假信息或者捏造信息。Collins 稱這是尚未解決的研究問題，不過他說，Gemini有迄今為止谷歌AI模型的最全面安全評估。為評估 Gemini 的安全性，谷歌對該模型進行了對抗性測試，模仿有不良企圖的用戶利用該模型輸入提示詞，幫助研究人員檢查模型中是否存在仇恨言論和政治偏見。這類測試包括“真實毒性提示詞”，它包含從網上提取的10萬多個提示詞。

　　谷歌強調Gemini的AI工具效率會非常高、速度非常快。它在谷歌自研的新版云芯片Tensor Processing Units（TPU）上訓練，TPU v5p的性能更強，該芯片訓練現(xiàn)有模型的速度比前代快2.8倍。TPU v5p是為數(shù)據中心的訓練和大模型運行而設計。

　　谷歌機器學習副總裁 Amin Vahdat 表示，這種方法讓谷歌“對未來標準AI基礎設施有了新的認識”。谷歌仍然使用第三方AI芯片運行Gemini 模型。

　　谷歌提供的下圖可見，谷歌數(shù)據中心內成排的谷歌云TPU v5p AI 加速器超級計算機。

版權聲明：本站內容除特別聲明的原創(chuàng)文章之外，轉載內容只為傳遞更多信息，并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經濟損失。聯(lián)系電話：010-82306118；郵箱：[email protected]。

谷歌推“最全能”AI模型Gemini正面硬扛GPT-4

日期： 2023-12-07

來源：華爾街見聞

相關內容