近日,阿里云發布了一項重大更新,宣布其PAI Model Gallery平臺現已支持云上一鍵部署DeepSeek-V3與DeepSeek-R1模型。這一舉措標志著AI模型開發流程的重大簡化,用戶無需編寫繁瑣的代碼,即可實現從模型訓練、部署到推理的全過程。
據悉,阿里云PAI Model Gallery的一鍵部署功能操作簡便,僅需三步即可完成。首先,用戶需登錄PAI控制臺,選擇并進入指定的工作空間。在左側導航欄中,快速開始選項下的Model Gallery等待著用戶的探索。
進入Model Gallery后,用戶可以在模型列表中輕松找到所需部署的DeepSeek模型。例如,點擊“DeepSeek-R1-Distill-Qwen-7B”模型卡片,即可進入該模型的詳細信息頁面。
在模型詳情頁,用戶只需點擊右上角的部署按鈕,即可開始模型的部署過程。值得注意的是,DeepSeek-R1支持vLLM加速部署,而DeepSeek-V3則不僅支持vLLM加速部署,還提供了Web應用部署的選項。DeepSeek-R1蒸餾小模型更可采用BladeLLM和vLLM進行加速部署。
部署成功后,用戶可以在服務頁面查看調用信息,獲取Endpoint和Token等關鍵信息。若對服務調用方式有疑問,用戶可點擊預訓練模型鏈接,返回模型介紹頁面查看詳細的調用方式說明。
本次部署的DeepSeek-R1-Distill-Qwen-7B模型是經過蒸餾處理的版本。它基于DeepSeek-R1的推理能力,通過蒸餾技術將推理模式遷移到了較小的Qwen模型上。同時,阿里云PAI Model Gallery也提供了DeepSeek-R1和DeepSeek-V3原始模型的一鍵部署服務,以滿足不同用戶的需求。