美東時間12月6日周三,,谷歌正式向公眾發(fā)布新一代大語言模型(LLM)Gemini,,號稱谷歌迄今為止“最大、也最全能的AI模型”,,有高級推理能力,,回答難題時“考慮得更仔細”。有別于其他公司LLM競品的是,,谷歌強調Gemeni是最靈活的模型,,因為它用不同大小的版本,可以適用于各種生成式AI應用,。
其中,,最輕盈的版本Gemni Nano可以直接在智能手機上離線運行,;相對而言更強大的版本Gemini Pro可以執(zhí)行多種任務,,將通過谷歌的類ChatGPT聊天機器人Bard,為眾多谷歌AI 服務提供支持,,加持谷歌的Gmail,、Maps Docs和YouTube等服務;功能最強大的版本Gemini Ultra也是谷歌迄今打造的最強大LLM,,主要為數據中心和企業(yè)應用而設計,。
谷歌旗下AI研究機構DeepMind的產品副總裁Eli Collins稱,Gemini的多樣性意味著,,它“能夠在從移動設備到大型數據中心的所有設備上運行,。”他表示,,谷歌早就希望打造的新一代AI模型更像是樂于助人的合作者,,而不是一種智能的軟件,Gemini讓谷歌距離這種遠景又近了一步,。
32種行業(yè)指標測試中 Gemini有30種遙遙領先GPT-4
現在Gemini只有英語版,,谷歌將很快推出其他語言的版本。谷歌CEO Sundar Pichai說,,Gemini代表了AI的新時代,。最終,Gemini將與谷歌的搜索引擎、廣告產品,、Chrome瀏覽器等更多產品結合,。
Gemini Nano手機電腦版周三可用 Gemini Pro支持Bard、下周面向云客戶 Gemini Ultra明年推行
具體應用時間表方面,,從本周三起,,安卓系統(tǒng)開發(fā)人員可以注冊使用Gemini Nano版,打造智能手機和電腦的Gemini支持App,。谷歌稱,,Gemini可以立即在其旗艦手機Pixel 8 Pro上啟用,實現諸如歸納電話錄音對話要點等新的生成式AI功能,。
Gemini Pro版從本周三開始支持Bard,,實現高級的推理、規(guī)劃,、理解等功能,,在170個國家地區(qū)以英語一種語言操作運行,可能不包括英國或者其他歐洲地區(qū),,因為谷歌稱在和當地的監(jiān)管機構合作,。
從12月13日下周三開始,谷歌將通過谷歌云,,在旗下Vertex AI 和 AI Studio平臺向云客戶提供 Gemini Pro版,。
Gemini Ultra將首先面向開發(fā)者和企業(yè)客戶開放,該版本的應用詳情將在下周公布,。谷歌計劃,,明年初,向公眾大范圍開放Gemini Ultra應用,。
谷歌還計劃,,明年初發(fā)布Gemini Ultra支持的進階版Bard Advanced,在面向大眾推出以前,,先將推出一個測試項目,,以便改進Bard Advanced。
谷歌的下圖展示了Gemini家族三個版本,。
谷歌此次毫不諱言和GPT-4一較高低的雄心,。發(fā)布Gemini前,谷歌對它進行了一系列以標準行業(yè)指標評估的測試,。谷歌稱,,在八項測試中,Gemini Pro有六項的表現優(yōu)于OpenAI 的 GPT-3.5,。在通用語言理解,、推理、數學和編碼方面測試中,八項基準指標里,,Gemini 有七項超過了OpenAI 的最新版模型 GPT-4,。
同時,谷歌評估了旗下可以解釋和生成代碼的最新生成式AI產品AlphaCode 2,,發(fā)現在競爭性編程領域,,它領先85%的競爭對手。
DeepMind的CEO Demis Hassabis稱,,谷歌運行了32種完善的基準指標相關測試,,對比Gemini和GPT-4這兩個模型,既有諸如多任務語言理解這類廣泛的整體測試,,到生成Python代碼這種單一能力的測試,。32種基準指標種,Gemini有30項都“遙遙領先”,。
以下谷歌報告的截圖可見,,在多選問題、數學問題,、Python代碼任務,、閱讀等方面,Gemini Pro和Ultra與GPT-4,、GPT-3.5等其他LLM的評分對比,。
Gemini為原生多模態(tài)模型 在谷歌更高性能云芯片TPU v5p訓練
谷歌稱,Gemini是一種“原生多模態(tài)”AI模型,。這意味著它從一開始就經過預先訓練,,可以處理用戶基于文本和圖像的提示詞任務,,支持文本和圖像的服務,。比如家長可以通過上傳數學問題的圖像,以及在工作表里嘗試解決問題的照片,,幫助孩子做家庭作業(yè),。Gemini還能閱讀答案,理解為何是對的,、為何是錯的,,并解釋需要進一步說明的概念。
谷歌稱,,谷歌搜索運用生成式AI技術的“搜索生成式體驗”在明年融入和Gemini的新功能,。
谷歌承認,Gemini仍然可能存在AI產生的虛假信息或者捏造信息,。Collins 稱這是尚未解決的研究問題,,不過他說,Gemini有迄今為止谷歌AI模型的最全面安全評估。為評估 Gemini 的安全性,,谷歌對該模型進行了對抗性測試,,模仿有不良企圖的用戶利用該模型輸入提示詞,幫助研究人員檢查模型中是否存在仇恨言論和政治偏見,。這類測試包括“真實毒性提示詞”,,它包含從網上提取的10萬多個提示詞。
谷歌強調Gemini的AI工具效率會非常高,、速度非??臁K诠雀枳匝械男掳嬖菩酒琓ensor Processing Units(TPU)上訓練,,TPU v5p的性能更強,,該芯片訓練現有模型的速度比前代快2.8倍。TPU v5p是為數據中心的訓練和大模型運行而設計,。
谷歌機器學習副總裁 Amin Vahdat 表示,,這種方法讓谷歌“對未來標準AI基礎設施有了新的認識”。谷歌仍然使用第三方AI芯片運行Gemini 模型,。
谷歌提供的下圖可見,,谷歌數據中心內成排的谷歌云TPU v5p AI 加速器超級計算機。