2 月 11 日消息,IBM 日前宣布,,DeepSeek-R1 蒸餾版 Llama 3.1 8B 和 Llama 3.3 70B 現(xiàn)已上線 IBM 的企業(yè)級 AI 開發(fā)平臺 watsonx.ai,。
根據(jù)官方介紹,DeepSeek 還借助知識蒸餾技術,,利用 R1 模型生成的數(shù)據(jù)優(yōu)化了多個 Llama 和 Qwen 變體,。用戶可通過以下方式在 watsonx.ai 上使用 DeepSeek 蒸餾模型:
在 watsonx.ai 的“按需部署”目錄中,IBM 提供 Llama 蒸餾版,,用戶可以部署專用實例以進行安全推理,。
用戶還可通過“自定義基礎模型”導入功能,上傳 DeepSeek-R1 其他變體,,例如 Qwen 蒸餾模型,。
DeepSeek-R1 具備強大的推理能力,適用于多個領域:
規(guī)劃:其“鏈式思維”邏輯有助于處理需要逐步推理的任務,,特別適合智能體(agentic)應用,。
編程:可用于代碼生成、調試和優(yōu)化,,提升開發(fā)效率,。
數(shù)學問題求解:具備處理復雜數(shù)學問題的能力,在科研,、工程和科學計算等領域表現(xiàn)突出,。
開發(fā)者可在 watsonx.ai 上利用 DeepSeek-R1 進行 AI 解決方案開發(fā),并使用以下解決方案能力:
直觀測試和評估模型輸出
通過連接向量數(shù)據(jù)庫和嵌入模型構建 RAG(檢索增強生成)管道
支持 LangChain,、CrewAI 等主流 AI 框架
IBM watsonx.ai 提供靈活的開源模型定制選項,,支持 DeepSeek-R1 在不同環(huán)境下的部署,并簡化智能體開發(fā),、微調,、RAG、提示工程等工作流,。此外,,watsonx.ai 內置安全機制,保障用戶應用的安全性,。
據(jù)此前報道,,IBM 首席執(zhí)行官本月初曾發(fā)表長文稱,他們(DeepSeek)僅用約 2000 枚英偉達芯片,,以大約 600 萬美元的成本訓練了最新的模型,,遠低于行業(yè)預期。這再次證明,小型,、高效的模型也能帶來實際成果,,無需依賴龐大而昂貴的專有系統(tǒng)。