百度近日正式推出了飛槳框架3.0版本,這一深度學習框架專為大型模型設計,標志著百度在人工智能基礎設施領域邁出了重要一步。飛槳框架3.0不僅在硬件適配和開發體驗上實現了全面進化,更是在大模型訓練、推理等多個方面帶來了顯著優化。
作為大模型時代的關鍵支撐,深度學習框架的重要性日益凸顯。飛槳框架3.0的發布,正是為了應對這一挑戰,它通過一系列創新技術,為大模型的訓練與推理提供了強有力的支持。
其中,“動靜統一自動并行”技術是飛槳框架3.0的一大亮點。這一技術通過智能地分配計算資源,大幅降低了大模型開發的訓練成本,使得算法創新能夠更專注于核心價值創造,而非繁瑣的技術細節。
飛槳框架3.0還采用了“訓推一體”的設計理念,打破了傳統訓練與推理之間的界限。通過全方位深度優化,飛槳框架3.0能夠支持眾多開源大模型進行高性能推理,并在DeepSeek V3 / R1等平臺上取得了卓越的性能表現。目前,該框架已支持文心4.5、文心X1等多款主流大模型,使得低時延、高吞吐、低算力成本的推理服務成為現實。
在科學智能領域,飛槳框架3.0同樣表現出色。它針對科學前沿探索的需求,提升了微分方程求解速度。通過高階自動微分和神經網絡編譯器技術,飛槳框架3.0在微分方程求解方面取得了顯著加速,速度遠超PyTorch等競爭對手。飛槳還對DeepXDE、Modulus等主流開源科學計算工具進行了廣泛適配,成為DeepXDE的默認推薦后端。
在運算速度方面,飛槳框架3.0借助創新的神經網絡編譯器CINN,實現了性能的顯著提升。在A100平臺上進行的RMSNorm算子性能測試顯示,經過編譯優化后的算子運行速度提升了4倍。在超過60個模型上的實驗表明,使用CINN編譯器后,超過60%的模型性能有顯著提升,平均提升幅度達到27.4%。
在硬件適配方面,飛槳框架3.0也推出了多芯片統一適配方案,構建了“一次開發,全棧部署”的生態體系。目前,該框架已適配超過60個芯片系列,覆蓋訓練集群、自動駕駛、智能終端等多個場景。這意味著開發者只需編寫一份代碼,就可以輕松實現程序在不同芯片上的順暢運行和業務的跨芯片遷移。
飛槳框架3.0的正式發布,標志著百度在深度學習框架領域取得了重要進展。截至2024年10月,飛槳文心生態已匯聚了1808萬開發者,服務了43萬家企事業單位,創建了101萬個模型。這一框架的推出,無疑將為人工智能領域的發展注入新的動力。
目前,飛槳框架3.0正式版本已面向開發者開放,并且兼容2.0版本的開發接口。這一舉措將使得更多開發者能夠輕松上手并使用這一強大的深度學習框架,共同推動人工智能技術的創新與發展。