午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

GPT-4.5高價引爭議,性能提升能否匹配DeepSeek 277倍之差?

   發布時間:2025-03-01 22:12 作者:柳晴雪

在科技界的萬眾矚目下,OpenAI于近日低調發布了其最新聊天模型GPT-4.5的研究預覽版。與兩年前GPT-4發布時的盛況相比,此次發布顯得尤為簡潔,甚至CEO Sam Altman也未現身直播現場,官方更是直言GPT-4.5并非前沿模型,種種跡象似乎預示著這次更新并非一次顛覆性的飛躍。

然而,盡管缺乏轟動效應,GPT-4.5作為OpenAI目前最新、最強的聊天模型,仍展現出了一定的進步。尤其在情商表現和減少幻覺方面,GPT-4.5相較于其前身GPT-4o有了顯著提升,準確率提高了24%,幻覺率降低了24.7%。這兩項改進直擊當前大模型使用中的痛點,對于提升用戶體驗具有重要意義。

但進步的背后,是令人咋舌的推理成本。GPT-4.5的API定價遠高于預期,輸入(緩存未命中)價格高達75美元/百萬tokens,是GPT-4o的30倍,更是DeepSeek-V3的277倍之多。如此高昂的價格,無疑給開發者的使用熱情澆上了一盆冷水,讓人不禁質疑其市場接受度。

盡管如此,GPT-4.5在對話理解上的提升仍值得肯定。在直播演示中,GPT-4.5展現出了對用戶需求和意圖的更好理解,能夠給出更加貼合人類情感的回應。例如,當用戶表示想發短信罵放鴿子的朋友時,GPT-4.5沒有直接提供憤怒的信息,而是提供了建設性的建議,相比之下,GPT-4o則顯得更為“機械”。

GPT-4.5在內部測試中也被認為與人類的對話方式更為接近,自然度有所提升。雖然這種提升在數據上并不顯著,但在實際體驗中,用戶往往能夠感受到GPT-4.5更加“人性化”的一面。

然而,與情商提升相比,幻覺減少或許更受用戶關注。在SimpleQA常識問答測試中,GPT-4.5編造答案或產生幻覺的比例約為37%,遠低于GPT-4o的近60%。這一改進對于提升模型的可信度和實用性具有重要意義。

盡管GPT-4.5在交互體驗和準確性上有所進步,但其高昂的推理成本仍是難以回避的問題。Sam Altman在社交平臺上透露,GPT-4.5是一個巨型、昂貴的模型,甚至需要增加數萬個GPU才能滿足更多用戶的需求。這一消息無疑加劇了開發者對成本的擔憂。

面對GPT-4.5的高價策略,業界反應不一。有觀點認為,GPT-4.5在特定用例上如寫作和頭腦風暴具有潛力,但整體而言只是交互變得更加順滑,并未帶來顛覆性的變革。這一評價或許能夠較為客觀地反映GPT-4.5的升級定位。

GPT-4.5在訓練上引入了“無監督學習擴展”技術,這是其在情商和幻覺方面有所改進的關鍵創新之一。無監督學習使模型能夠從大量未標注的數據中學習語言模式和知識,從而提高了模型的準確性和直覺能力。這一技術的引入,或許能夠為未來大模型的發展提供新的思路。

盡管GPT-4.5的推理成本高昂,但其仍不失為一款值得期待的聊天模型。對于ChatGPT的訂閱用戶而言,GPT-4.5的引入或許能為他們提供更多的續訂理由。而對于整個大模型行業而言,GPT-4.5的發布無疑將進一步推動技術的進步和市場的競爭。

在DeepSeek等競爭對手的強勁勢頭下,GPT-4.5的發布無疑為行業注入了新的活力。盡管面臨諸多挑戰,但OpenAI仍以其不懈的努力和創新精神,持續推動著大模型技術的發展。未來,我們期待看到更多優秀的大模型涌現,為人類社會帶來更多的便利和驚喜。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新