在AI領(lǐng)域的一次重大突破中,DeepSeek R1蒸餾模型的推出標(biāo)志著行業(yè)邁向了全新的發(fā)展階段。這一新一代終端側(cè)推理模型,其性能卓越,讓以往僅在云端才能實(shí)現(xiàn)的AI功能得以在終端設(shè)備上展現(xiàn),預(yù)示著終端側(cè)AI處理新時(shí)代的到來,既安全又可靠。
高通技術(shù)公司近期發(fā)布的白皮書《AI變革推動(dòng)終端側(cè)推理創(chuàng)新》,深入剖析了DeepSeek R1發(fā)布背后的AI行業(yè)大趨勢(shì)。隨著訓(xùn)練成本的降低、推理部署的加速以及對(duì)邊緣環(huán)境創(chuàng)新的關(guān)注,AI領(lǐng)域正經(jīng)歷深刻變革。科技界不再僅僅專注于構(gòu)建更大的模型,而是轉(zhuǎn)向如何在邊緣側(cè)實(shí)際應(yīng)用中高效部署這些模型。大型基礎(chǔ)模型的蒸餾技術(shù)催生了眾多更智能、更小巧、更高效的模型,為各行業(yè)尤其是終端側(cè)AI的快速集成提供了可能。
DeepSeek R1作為尖端AI推理模型的代表,其一經(jīng)發(fā)布便在科技界掀起波瀾。其性能不僅與同類先進(jìn)模型相當(dāng),甚至在某些方面超越,徹底顛覆了AI發(fā)展的傳統(tǒng)觀念。這一關(guān)鍵時(shí)刻是行業(yè)創(chuàng)新趨勢(shì)的一部分,展現(xiàn)了在打造高質(zhì)量小語言模型和多模態(tài)推理模型方面的進(jìn)展,以及這些創(chuàng)新如何為AI的商用應(yīng)用和終端側(cè)推理落地鋪平道路。
當(dāng)前,四大趨勢(shì)正顯著提升終端側(cè)運(yùn)行的AI模型的質(zhì)量、性能和效率。首先,先進(jìn)的AI小模型已具備出色性能,新技術(shù)如模型蒸餾和創(chuàng)新AI網(wǎng)絡(luò)架構(gòu)能夠在不影響質(zhì)量的前提下簡(jiǎn)化開發(fā)流程,使新模型的表現(xiàn)超越一年前僅在云端運(yùn)行的大型模型。其次,模型參數(shù)規(guī)模迅速縮小,得益于先進(jìn)的量化和剪枝技術(shù),開發(fā)者能夠在不犧牲準(zhǔn)確性的前提下減小模型規(guī)模。再者,邊緣側(cè)應(yīng)用日益豐富,高質(zhì)量AI模型的激增使得文本摘要、編程助手、實(shí)時(shí)翻譯等功能在智能手機(jī)等終端設(shè)備上普及,為AI在邊緣側(cè)的規(guī)模化部署提供了商用應(yīng)用支持。最后,AI正成為新的用戶界面,個(gè)性化多模態(tài)AI智能體將簡(jiǎn)化交互,高效跨越不同應(yīng)用完成任務(wù)。
高通技術(shù)公司在AI訓(xùn)練向大規(guī)模推理轉(zhuǎn)型以及AI計(jì)算處理從云端向邊緣側(cè)擴(kuò)展方面擁有戰(zhàn)略優(yōu)勢(shì)。公司在定制CPU、NPU、GPU和低功耗子系統(tǒng)開發(fā)方面取得了顯著成就。通過與模型開發(fā)商合作,并提供面向不同邊緣終端領(lǐng)域的模型部署工具、框架和SDK,高通技術(shù)公司助力開發(fā)者在邊緣側(cè)加速采用AI智能體和應(yīng)用。
近期,AI模型訓(xùn)練方式的顛覆性變革和重新評(píng)估進(jìn)一步驗(yàn)證了AI格局向大規(guī)模推理轉(zhuǎn)變的趨勢(shì),這將開啟全新的邊緣側(cè)推理計(jì)算創(chuàng)新和升級(jí)周期。盡管模型訓(xùn)練仍將在云端進(jìn)行,但推理將受益于高通技術(shù)廣泛終端的采用,從而催生更多邊緣側(cè)AI賦能處理器的需求。
高通公司總裁兼CEO安蒙在2025財(cái)年第一季度財(cái)報(bào)電話會(huì)議中分享了對(duì)當(dāng)前AI行業(yè)發(fā)展趨勢(shì)的看法。他表示,高通在連接、計(jì)算和邊緣AI技術(shù)方面的領(lǐng)先組合,持續(xù)保持高度差異化,并在多個(gè)行業(yè)中愈發(fā)重要。高通對(duì)邊緣側(cè)AI機(jī)遇持樂觀態(tài)度,尤其是在迎來新一輪AI創(chuàng)新和規(guī)模化擴(kuò)展周期之際。DeepSeek R1及其他類似模型的推出,展示了AI模型正以更快的速度發(fā)展,變得更小、更強(qiáng)大、更高效,并可直接在終端側(cè)運(yùn)行。事實(shí)上,DeepSeek R1蒸餾模型在發(fā)布僅幾天內(nèi)便能在搭載驍龍平臺(tái)的智能手機(jī)和PC上運(yùn)行。
安蒙還提到,隨著進(jìn)入AI推理時(shí)代,模型訓(xùn)練仍將在云端進(jìn)行,但推理將越來越多地在終端側(cè)運(yùn)行,使AI更加便捷、可定制且高效。這將促進(jìn)更多專用模型和應(yīng)用的開發(fā)和采用,從而推動(dòng)各類終端對(duì)高通平臺(tái)的需求。憑借行業(yè)最強(qiáng)大和高效的邊緣側(cè)AI處理器,高通在推動(dòng)這一轉(zhuǎn)型方面具有獨(dú)特優(yōu)勢(shì),并將從即將到來的變革中受益。