近日,DeepSeek-V3模型迎來了其最新的小版本更新,版本號被標記為DeepSeek-V3-0324。官方于昨晚詳細披露了此次升級的具體內容,為用戶帶來了全新的使用體驗。
據官方公告,此次更新后的DeepSeek V3模型,用戶只需在官方網頁、App以及小程序中關閉深度思考功能,即可直接體驗。而API接口的使用方式則保持原樣,無需任何改動。對于非復雜推理任務,官方強烈推薦用戶嘗試新版本V3模型,享受更加流暢的對話速度和全面提升的使用效果。
在新版V3模型中,最引人注目的變化在于其推理任務表現的大幅提升。通過借鑒DeepSeek-R1模型訓練中的強化學習技術,新版V3模型在數學、代碼類評測集上的表現甚至超過了GPT-4.5的得分,這無疑是對其技術實力的一次有力證明。
除此之外,新版V3模型在百科知識、數學以及代碼任務上的表現均有所提升。特別是在HTML等前端代碼任務上,新版模型生成的代碼不僅可用性更高,而且視覺效果也更加美觀,富有設計感。一張動圖展示了模型生成的p5.js程序,該程序能夠演示多個小球在指定空間范圍內的運動,并包含可調整重力、摩擦力等參數的滑動按鈕,整體以賽博朋克風格的HTML呈現,令人眼前一亮。
在中文寫作方面,新版V3模型同樣進行了優化。基于R1模型的寫作水平,新版V3模型進一步提升了內容質量,尤其是在中長篇文本創作上,表現尤為突出。幾張展示新版模型中文寫作能力的圖片,更是讓人對其進步刮目相看。
新版V3模型在中文搜索能力上也進行了優化。在聯網搜索場景下,對于報告生成類指令,新版模型能夠輸出內容更為詳實準確、排版更加清晰美觀的結果,進一步提升了用戶的使用體驗。
新版V3模型在工具調用、角色扮演、問答閑聊等方面也均有所提升,為用戶帶來了更加全面、豐富的使用體驗。在模型開源方面,DeepSeek-V3-0324與之前的DeepSeek-V3使用相同的base模型,僅對后訓練方法進行了改進。私有化部署時,用戶只需更新checkpoint和tokenizer_config.json(tool calls相關變動)即可。模型參數約660B,開源版本上下文長度為128K(網頁端、App和API提供64K上下文)。用戶可在Huggingface平臺上下載V3-0324模型權重。
此次DeepSeek-V3模型的更新,無疑是一次全面的技術升級,為用戶帶來了更加優質的使用體驗。我們期待在未來,DeepSeek能夠繼續發揮其技術優勢,為用戶帶來更多驚喜。