午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

<abbr id="6ek9k"><track id="6ek9k"></track></abbr>

<bdo id="6ek9k"><tbody id="6ek9k"></tbody></bdo>

<li id="6ek9k"></li>

資訊在沃

當前位置：沃資訊 > 游戲 > 正文內(nèi)容

騰訊發(fā)布Hunyuan-Large大模型：389B總參數(shù)與52B激活參數(shù)，業(yè)界領(lǐng)先！

發(fā)布時間：2024-11-05 17:14 來源：ITBEAR 作者：楊凌霄

騰訊近日推出了業(yè)界領(lǐng)先的Hunyuan-Large大模型，該模型基于Transformer架構(gòu)，并采用了MoE（Mixture of Experts）設(shè)計。據(jù)悉，這是目前業(yè)界已經(jīng)開源的最大規(guī)模的MoE模型，擁有驚人的3890億總參數(shù)和520億激活參數(shù)。

騰訊在Hugging Face平臺上開源了Hunyuan-A52B的三個版本，包括預(yù)訓(xùn)練版、指令版和指令版FP8，同時發(fā)布了詳盡的技術(shù)報告與操作手冊，供開發(fā)者深入了解模型的功能及操作方法。

Hunyuan-Large模型具備多項技術(shù)優(yōu)勢，例如通過高質(zhì)量合成數(shù)據(jù)增強訓(xùn)練，使模型能夠?qū)W習(xí)到更為豐富的數(shù)據(jù)表示，有效處理長上下文輸入，并提升了對未見數(shù)據(jù)的泛化能力。模型還采用了創(chuàng)新的KV緩存壓縮技術(shù)，通過分組查詢注意力和跨層注意力策略，大幅降低了內(nèi)存占用和計算成本，從而提高了推理效率。

該模型還引入了專家特定學(xué)習(xí)率縮放技術(shù)，為不同的專家子模型設(shè)定了差異化的學(xué)習(xí)率，確保了每個子模型都能從數(shù)據(jù)中高效學(xué)習(xí)，并為模型的整體性能作出貢獻。在長上下文處理能力方面，Hunyuan-Large也表現(xiàn)出色，其預(yù)訓(xùn)練模型支持處理長達256K的文本序列，而指令版模型則支持128K的文本序列，顯著增強了處理長上下文任務(wù)的能力。

為了驗證模型的實際應(yīng)用效果和安全性，騰訊在多種語言和任務(wù)上進行了廣泛的基準測試。測試結(jié)果充分證明了Hunyuan-Large模型的卓越性能和廣泛適用性。

對于想要深入了解Hunyuan-Large模型的開發(fā)者和研究者，騰訊提供了豐富的資源鏈接，包括論文、Github倉庫、Huggingface模型庫以及騰訊云上的相關(guān)產(chǎn)品頁面。

更多>同類內(nèi)容

米哈游傳聞大幅削減云預(yù)算，某云大廠或遭預(yù)算減半

11-05

亞馬遜首款彩墨電紙書遭用戶投訴背光不均，公司回應(yīng)稱正在調(diào)查

11-05

港股消費電子股走強！旺季新品頻出，泛科技行情持續(xù)擴散

11-05

藍寶石新款PULSE脈動B650M WIFI主板發(fā)布：支持DDR5-7400+，售價899元！

11-05

史上首次！首席大檢察官的這份專項報告透露了什么？

11-05

“時差”縮小再縮小！才下展臺就上處方

11-05

不是第一次了！綿陽這群“救火搭子”出手“快準狠”｜看見正能量

11-05

30秒 | 人民公園菊花展來了賞菊最佳時間還等十天

11-05

傳音新款I(lǐng)tel S25 Ultra手機即將登陸印度，售價或低于1200元，配置亮眼！

11-05

羽美同行｜高新米蘭柏羽吳鳳玲：東方美比想象中更高級

11-05

蘋果新系統(tǒng)iOS 18.2 Beta 2上線：Siri升級，可選付費ChatGPT Plus服務(wù)

11-05

華為Mate 70系列即將亮相，機構(gòu)密集調(diào)研相關(guān)概念股，這家企業(yè)竟被訪65次！

11-05

騰訊領(lǐng)銜！中國市場回購潮涌現(xiàn)，回購金額首超股權(quán)融資

11-05

“聽得懂話”的理發(fā)師直播，超10萬人圍觀！網(wǎng)友喊話全國“巡剪”，本人回應(yīng)

11-05

最會買2.40版本更新：一鍵收藏比價商品，輕松拿高返！

11-05

點擊查看更多 +

全站最新

飛牛私有云fnOS 0.8.23版本全新上線：端口自定義功能亮相，安全性再升級！

飛牛私有云fnOS 0.8.23版本全新上線：端口自定義功能亮相，安全性再升級！

米哈游傳聞大幅削減云預(yù)算，某云大廠或遭預(yù)算減半

米哈游傳聞大幅削減云預(yù)算，某云大廠或遭預(yù)算減半

《野狗子》游戲評測出爐：IGN打出5分，指其敵人種類單一、追逐戰(zhàn)體驗差

《野狗子》游戲評測出爐：IGN打出5分，指其敵人種類單一、追逐戰(zhàn)體驗差

亞馬遜首款彩墨電紙書遭用戶投訴背光不均，公司回應(yīng)稱正在調(diào)查

亞馬遜首款彩墨電紙書遭用戶投訴背光不均，公司回應(yīng)稱正在調(diào)查

努比亞紅魔聯(lián)合京東方，推出首款1.5K屏下攝像全面屏，創(chuàng)新科技引領(lǐng)行業(yè)新風(fēng)向！

努比亞紅魔聯(lián)合京東方，推出首款1.5K屏下攝像全面屏，創(chuàng)新科技引領(lǐng)行業(yè)新風(fēng)向！

大眾集團美國CEO或?qū)㈦x職，中國乘用車品牌CEO成接班人選？

大眾集團美國CEO或?qū)㈦x職，中國乘用車品牌CEO成接班人選？

三星S25+性能曝光：搭載Exynos 2500芯片，多核跑分高達8141分！

三星S25+性能曝光：搭載Exynos 2500芯片，多核跑分高達8141分！

三問宜賓消防：入冬火災(zāi)如何防？職能拓展重點在哪里？救援能力提升得如何？

三問宜賓消防：入冬火災(zāi)如何防？職能拓展重點在哪里？救援能力提升得如何？

熱門內(nèi)容

本欄最新

騰訊發(fā)布Hunyuan-Large大模型：389B總參數(shù)與52B激活參數(shù)，業(yè)界領(lǐng)先！

騰訊發(fā)布Hunyuan-Large大模型：389B總參數(shù)與52B激活參數(shù)，業(yè)界領(lǐng)先！

米哈游傳聞大幅削減云預(yù)算，某云大廠或遭預(yù)算減半

米哈游傳聞大幅削減云預(yù)算，某云大廠或遭預(yù)算減半

亞馬遜首款彩墨電紙書遭用戶投訴背光不均，公司回應(yīng)稱正在調(diào)查

亞馬遜首款彩墨電紙書遭用戶投訴背光不均，公司回應(yīng)稱正在調(diào)查

港股消費電子股走強！旺季新品頻出，泛科技行情持續(xù)擴散

港股消費電子股走強！旺季新品頻出，泛科技行情持續(xù)擴散

藍寶石新款PULSE脈動B650M WIFI主板發(fā)布：支持DDR5-7400+，售價899元！

藍寶石新款PULSE脈動B650M WIFI主板發(fā)布：支持DDR5-7400+，售價899元！

史上首次！首席大檢察官的這份專項報告透露了什么？

史上首次！首席大檢察官的這份專項報告透露了什么？

“時差”縮小再縮小！才下展臺就上處方

“時差”縮小再縮小！才下展臺就上處方

不是第一次了！綿陽這群“救火搭子”出手“快準狠”｜看見正能量

不是第一次了！綿陽這群“救火搭子”出手“快準狠”｜看見正能量

沃資訊門戶 · 資訊在沃千萬用戶的默認資訊主頁廣告投放：ad@wwo.com.cn
Copyright ? wwo.com.cn All rights reserved. 魯ICP備11015305號-23

<label id="i0on0"><samp id="i0on0"></samp></label>

<thead id="i0on0"><optgroup id="i0on0"><samp id="i0on0"></samp></optgroup></thead>

<li id="i0on0"></li>

<bdo id="i0on0"><meter id="i0on0"></meter></bdo>

<span id="i0on0"><small id="i0on0"></small></span>

<thead id="i0on0"></thead>

<span id="i0on0"></span>