清華大學高性能計算研究所傳來重要消息,翟季冬教授團隊攜手清華系科創(chuàng)先鋒清程極智,共同宣布了一項重大開源成果——大模型推理引擎“赤兔 Chitu”。
這款引擎開創(chuàng)性地實現(xiàn)了在非英偉達Hopper架構GPU及眾多國產(chǎn)芯片上的FP8精度模型原生運行,顯著降低了推理成本,性能更是實現(xiàn)了翻倍。據(jù)悉,赤兔引擎被精準定位為“生產(chǎn)級大模型推理引擎”,旨在為用戶帶來多重優(yōu)勢。
首先,赤兔引擎具備強大的多元算力適配能力。無論是NVIDIA的最新旗艦產(chǎn)品,還是舊款的多系列產(chǎn)品,亦或是國產(chǎn)芯片,赤兔引擎都能提供優(yōu)化的支持,確保了廣泛的兼容性。
其次,赤兔引擎全場景可伸縮的特性使其應用場景更加靈活。無論是純CPU部署、單GPU部署,還是大規(guī)模集群部署,赤兔引擎都能提供可擴展的解決方案,滿足不同場景下的需求。
赤兔引擎的長期穩(wěn)定運行能力也是其一大亮點。在實際生產(chǎn)環(huán)境中,赤兔引擎的穩(wěn)定性足以承載高并發(fā)的業(yè)務流量,確保了業(yè)務的連續(xù)性和穩(wěn)定性。
在部署DeepSeek-R1-671B滿血版時,赤兔引擎在A800集群的測試中展現(xiàn)出了卓越的性能。與部分國外開源框架相比,赤兔引擎在實現(xiàn)GPU使用量減少50%的同時,推理速度還提升了3.15倍,這一成績無疑令人矚目。
對于廣大開發(fā)者和用戶而言,赤兔引擎的開源無疑是一個巨大的福音。現(xiàn)在,大家可以通過訪問GitHub上的開源地址(https://github.com/thu-pacman/chitu),輕松獲取并體驗這款強大的大模型推理引擎。