近日,DeepSeek在官方欽定的“開源周”內動作頻頻,已陸續開源四個項目,并在星期四最新發布了名為DualPipe的技術,該技術實現了計算與通信的雙向并行處理。與此同時,DeepSeek還推出了一項別出心裁的舉措——錯峰定價。
在2月26日,DeepSeek宣布自即日起,于北京時間每日00:30至08:30的夜間空閑時段,推出錯峰優惠活動。而就在前一天,DeepSeek才剛剛恢復了官方的API充值服務。此次優惠力度之大,令人矚目。根據官方公告,在夜間空閑時段,DeepSeek API的調用價格將大幅下降:DeepSeek-V3降至原價的50%,而DeepSeek-R1更是低至25%(即降價75%)。
具體價格調整如圖所示,DeepSeek此次的優惠力度無疑為開發者們帶來了實質性的利益。值得注意的是,與DeepSeek-V3發布之初的“優惠體驗期”有明確的時間期限不同,這次的錯峰優惠僅有“時段限制”,而沒有明確的“期限”。因此,我們可以將其視為一種長期的“錯峰定價”策略。
DeepSeek-V3和DeepSeek-R1兩款模型在優惠時段的價格也變得完全一致。輸入(緩存命中)為0.25元/百萬tokens,輸入(緩存未命中)為1元/百萬tokens,輸出為4元/百萬tokens。這一策略可能也是DeepSeek有意為之,旨在降低開發者使用DeepSeek-R1的成本顧慮,同時模糊兩種模型的邊界,鼓勵開發者根據需求靈活調用。
DeepSeek此次調整最核心的變化在于采用了“錯峰定價”的運營策略。這一策略的優勢顯而易見,很可能引發其他大模型如豆包、通義千問等的跟進,甚至可能再次掀起一場大模型價格戰。回顧2024年初DeepSeek-V2發布后,就曾掀起過一場價格戰。
事實上,DeepSeek-V3在之前已經有過降價歷史。在其“優惠體驗期”結束前,全時段的優惠價甚至比現在優惠時段的價格還要便宜。然而,DeepSeek-R1自發布以來價格一直未變。因此,此次DeepSeek-R1高達75%的“錯峰降價”無疑給開發者們帶來了更大的驚喜。
從能力上看,DeepSeek-R1的表現已經無需多言。無論是產品層面思維鏈的創新,還是工程層面實現的極致成本,都讓DeepSeek-R1成為了當下備受矚目的模型。降價策略無疑將進一步降低開發者調用成本和門檻,間接推動更好的AI體驗在更多AI應用中推廣。
以字節跳動旗下的豆包通用模型為例,其價格相較于DeepSeek在優惠時段的價格仍顯偏高。甚至DeepSeek-R1官方滿血版在優惠時段的價格,比32b蒸餾版還要更便宜。這不僅在國內市場具有競爭力,在海外市場也同樣如此。DeepSeek-R1/V3在海外也推出了同樣的運營策略,大幅降價50%和75%,優惠時段直接對應北京時間00:30至08:30,對于面向部分海外用戶市場的開發者來說,具有更強的吸引力。
錯峰定價本身并不新奇,類似于我們熟悉的錯峰電價。DeepSeek官方在新聞稿中也表示,推出錯峰優惠活動是為了鼓勵用戶充分利用這一時段,享受更經濟、更流暢的服務體驗。從開發者的角度來看,這種運營策略幾乎百利而無一害;從大模型廠商和云計算平臺的角度看,也是利大于弊,可以更大程度地利用服務器資源。
因此,目前來看,其他大模型跟進錯峰定價的運營策略應該是題中應有之義。只是具體策略上可能會有所不同,比如需要考慮不同時區(不同用戶市場)的問題。然而,DeepSeek此次舉措是否會引發行業連鎖反應,甚至復刻一年前的大模型價格戰,仍有待觀察。
回顧2024年5月初,DeepSeek發布了第二代MoE大模型DeepSeek-V2,并首次引入了多頭潛在注意力(MLA)機制。更重要的是,其價格僅為當時ChatGPT主力模型GPT-4 Turbo的近百分之一,在性價比上直接秒殺了國內外一眾大模型。此次DeepSeek在開源周展現出一系列能力,如長上下文的突破、芯片利用效率的提升等,未必不會是又一輪大模型價格戰的“新開端”。