午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

清華開源赤兔大模型推理引擎,國產(chǎn)芯片上DeepSeek推理成本減半性能翻倍

   發(fā)布時間:2025-03-14 20:59 作者:陸辰風

清華大學高性能計算研究所傳來重要消息,翟季冬教授團隊攜手清華系科創(chuàng)先鋒清程極智,共同宣布了一項重大開源成果——大模型推理引擎“赤兔 Chitu”。

這款引擎開創(chuàng)性地實現(xiàn)了在非英偉達Hopper架構GPU及眾多國產(chǎn)芯片上的FP8精度模型原生運行,顯著降低了推理成本,性能更是實現(xiàn)了翻倍。據(jù)悉,赤兔引擎被精準定位為“生產(chǎn)級大模型推理引擎”,旨在為用戶帶來多重優(yōu)勢。

首先,赤兔引擎具備強大的多元算力適配能力。無論是NVIDIA的最新旗艦產(chǎn)品,還是舊款的多系列產(chǎn)品,亦或是國產(chǎn)芯片,赤兔引擎都能提供優(yōu)化的支持,確保了廣泛的兼容性。

其次,赤兔引擎全場景可伸縮的特性使其應用場景更加靈活。無論是純CPU部署、單GPU部署,還是大規(guī)模集群部署,赤兔引擎都能提供可擴展的解決方案,滿足不同場景下的需求。

赤兔引擎的長期穩(wěn)定運行能力也是其一大亮點。在實際生產(chǎn)環(huán)境中,赤兔引擎的穩(wěn)定性足以承載高并發(fā)的業(yè)務流量,確保了業(yè)務的連續(xù)性和穩(wěn)定性。

在部署DeepSeek-R1-671B滿血版時,赤兔引擎在A800集群的測試中展現(xiàn)出了卓越的性能。與部分國外開源框架相比,赤兔引擎在實現(xiàn)GPU使用量減少50%的同時,推理速度還提升了3.15倍,這一成績無疑令人矚目。

對于廣大開發(fā)者和用戶而言,赤兔引擎的開源無疑是一個巨大的福音。現(xiàn)在,大家可以通過訪問GitHub上的開源地址(https://github.com/thu-pacman/chitu),輕松獲取并體驗這款強大的大模型推理引擎。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新