《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 馬斯克:現(xiàn)實世界中用于訓練AI模型的數(shù)據(jù)已經所剩無幾

馬斯克:現(xiàn)實世界中用于訓練AI模型的數(shù)據(jù)已經所剩無幾

2025-01-10
來源:IT之家
關鍵詞: AI模型 人工智能

1 月 9 日消息,,據(jù) TechCrunch 報道,,馬斯克與其他人工智能專家一致認為,,現(xiàn)實世界中用于訓練 AI 模型的數(shù)據(jù)幾乎已經耗盡,。

0.png

在周三晚間與 Stagwell 董事會主席馬克?佩恩的直播對話中,馬斯克表示:“我們現(xiàn)在基本上已經消耗掉了所有人類知識的積累…… 用于人工智能訓練的數(shù)據(jù),。這個現(xiàn)象基本上是去年發(fā)生的,?!?/p>

馬斯克此番言論與前 OpenAI 首席科學家伊利亞?蘇茨克弗(Ilya Sutskever)在去年 12 月的 NeurIPS 會議上的觀點相似,。蘇茨克弗曾指出,,AI 行業(yè)已經達到了所謂的“數(shù)據(jù)峰值”,并預測未來缺乏足夠的訓練數(shù)據(jù),,將迫使 AI 模型的開發(fā)方式發(fā)生改變,。

馬斯克認為,合成數(shù)據(jù)(IT之家注:即人工智能模型自我生成的數(shù)據(jù))是未來的解決方案?!把a充現(xiàn)實世界數(shù)據(jù)的唯一途徑是通過合成數(shù)據(jù),,也就是讓 AI 自己生成訓練數(shù)據(jù)。AI 會進行自我評估,,并通過這一自我學習的過程不斷優(yōu)化自己,。”

目前,,許多科技公司,,包括微軟、Meta,、OpenAI 和 Anthropic 等,已經開始使用合成數(shù)據(jù)來訓練他們的主力 AI 模型,。據(jù) Gartner 估計,,到 2024 年,用于人工智能和數(shù)據(jù)分析項目的 60% 數(shù)據(jù)將是通過合成方式生成的,。

使用合成數(shù)據(jù)的一個顯著優(yōu)勢是降低成本,。人工智能初創(chuàng)公司 Writer 表示,其 Palmyra X 004 模型幾乎完全依賴合成數(shù)據(jù)進行開發(fā),,開發(fā)成本僅為 70 萬美元,,而一個規(guī)模相似的 OpenAI 模型的開發(fā)成本大約為 460 萬美元。

然而,,合成數(shù)據(jù)也存在一定的風險,。研究表明,合成數(shù)據(jù)可能會導致模型性能下降,,輸出結果不僅缺乏創(chuàng)新性,,而且可能變得更加偏頗,最終嚴重影響其功能性,。因為模型是通過自己生成合成數(shù)據(jù)進行訓練的,,如果這些數(shù)據(jù)本身帶有偏見或局限性,那么最終模型的輸出也會受到這些因素的影響,。


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點,。轉載的所有的文章,、圖片、音/視頻文件等資料的版權歸版權所有權人所有,。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118,;郵箱:aet@chinaaet.com,。