近日,NVIDIA悄然推出了一款名為Nemotron-70B的AI模型,該模型在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)出色,超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內(nèi)的140多個(gè)開(kāi)閉源模型,其性能僅次于OpenAI的最新模型o1。
AI社區(qū)對(duì)此反應(yīng)熱烈,紛紛驚嘆新的開(kāi)源王者是否已經(jīng)到來(lái)。業(yè)內(nèi)人士更是高度評(píng)價(jià),認(rèn)為用Llama 3.1訓(xùn)出的小模型能超越GPT-4o,實(shí)屬神來(lái)之筆。
Nemotron-70B基于Llama-3.1-70B開(kāi)發(fā),它能夠在沒(méi)有專門(mén)提示和額外推理token的情況下,正確回答復(fù)雜的推理問(wèn)題,例如“草莓有幾個(gè)r”的經(jīng)典難題。
業(yè)內(nèi)人士指出,NVIDIA在Llama 3.1基礎(chǔ)上訓(xùn)練出的這個(gè)相對(duì)不大的模型,能夠超越GPT-4o和Claude 3.5 Sonnet,這標(biāo)志著一次技術(shù)上的重大飛躍。
目前,Llama-3.1-Nemotron-70B-Instruct已經(jīng)可以在線體驗(yàn),為用戶提供了直接感受這款強(qiáng)大模型的機(jī)會(huì)。
除了推出Nemotron-70B模型,英偉達(dá)還開(kāi)源了用于訓(xùn)練該模型的數(shù)據(jù)集HelpSteer2。該數(shù)據(jù)集包含21362個(gè)提示響應(yīng),旨在使模型更符合人類偏好,同時(shí)也更有幫助、更符合事實(shí)、更連貫。該數(shù)據(jù)集還包含20324個(gè)用于訓(xùn)練的提示響應(yīng)和1038個(gè)用于驗(yàn)證的提示響應(yīng)。