午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

馬斯克警示:AI訓練數據已達極限,未來靠合成數據突破?

   發布時間:2025-01-13 22:53 作者:江紫萱

近期,科技界巨頭馬斯克在CES展會上發表了一席引人深思的言論。他提到,當前用于訓練人工智能(AI)模型的現實世界數據資源已接近枯竭,這一臨界點據他判斷,是在去年,即2024年。

馬斯克強調,人類長期積累的知識幾乎已被AI訓練完全消耗。這一觀點并非孤例,早前在“NeurIPS”機器學習會議上,OpenAI的前科學主管Ilya Sutskever也曾表達過類似的看法,他認為AI行業所能利用的數據量已達到極限。

面對數據資源的稀缺,馬斯克提出了一個創新性的解決方案:合成數據。他認為,未來AI的發展將高度依賴于由AI自行生成的數據。這種數據不僅能夠補充現實世界的不足,還能讓AI通過自我評估和學習,實現更高效的訓練。

事實上,這一趨勢已經初現端倪。多家科技巨頭,包括微軟、meta、OpenAI和Anthropic等,已經開始在AI模型訓練中廣泛應用合成數據。據科技市場研究機構Gartner預測,2024年,AI及分析項目所使用的數據中,合成數據占比已高達60%。

以微軟為例,其在今年1月8日開源的AI模型“Phi-4”,便是結合了合成數據和現實世界數據進行訓練的。同樣,谷歌的“Gemma”模型也采用了這一策略。Anthropic則利用部分合成數據開發了表現出色的“Claude 3.5 Sonnet”系統。而meta則通過AI生成的數據,對其最新推出的Llama系列模型進行了微調。

隨著AI技術的不斷發展,合成數據的應用前景愈發廣闊。它不僅能夠解決現實世界數據稀缺的問題,還能為AI提供更豐富、更多樣的訓練環境,從而推動AI技術的持續進步。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新