OpenAI公司近期宣布了一項重要更新,推出了GPT-4.1系列模型,這一消息引起了業(yè)界的廣泛關(guān)注。此次發(fā)布的模型包括GPT-4.1、GPT-4.1 mini以及GPT-4.1 nano,它們通過API的形式向開發(fā)者開放。
據(jù)悉,GPT-4.1系列模型在多個方面相較于前代GPT-4o及其小型版本GPT-4o mini有了顯著提升。特別是在編程能力、指令遵循以及長文本理解上,GPT-4.1系列模型展現(xiàn)出了更為卓越的性能。這些模型的上下文窗口支持高達(dá)100萬tokens,且知識庫已更新至2024年6月,確保了信息的時效性和準(zhǔn)確性。
值得注意的是,目前GPT-4.1系列模型僅通過開發(fā)者API提供,普通用戶暫時無法直接在ChatGPT頁面上體驗這些新模型。這一舉措顯示了OpenAI對開發(fā)者社區(qū)的重視,以及其在推動AI技術(shù)發(fā)展和應(yīng)用方面的決心。
在編程方面,GPT-4.1模型相較于GPT-4o模型,代碼生成速度提升了40%,同時用戶輸入查詢的成本降低了80%。這一顯著的改進(jìn)使得GPT-4.1在編程領(lǐng)域具有更高的效率和更低的成本,為開發(fā)者提供了更為強(qiáng)大的工具。
GPT-4.1系列模型在多項基準(zhǔn)測試中均表現(xiàn)出色。在編程測試SWE-bench Verified中,GPT-4.1得分54.6%,較GPT-4o提升了21.4個百分點。在指令遵循測試MultiChallenge中,GPT-4.1也提升了10.5個百分點。而在多模態(tài)長文本測試Video-MME中,GPT-4.1更是創(chuàng)下了72.0%的新紀(jì)錄。這些測試結(jié)果表明,GPT-4.1系列模型在多個領(lǐng)域都具有卓越的性能。
除了GPT-4.1之外,GPT-4.1 mini和nano也展現(xiàn)了小型模型的巨大潛力。GPT-4.1 mini在多項基準(zhǔn)測試中媲美甚至超越了GPT-4o,同時延遲降低了近一半,成本減少了83%。而GPT-4.1 nano作為最快、最經(jīng)濟(jì)的選擇,擁有100萬token的上下文窗口,在MMLU測試中得分80.1%,適合分類和自動補(bǔ)全任務(wù)。
GPT-4.1系列模型在實際應(yīng)用中同樣表現(xiàn)出色。例如,在Windsurf測試中,GPT-4.1在編程效率上提升了30%,減少了50%的不必要編輯。而在Thomson Reuters的法律AI助手CoCounsel中,使用GPT-4.1后,多文檔審查準(zhǔn)確率提升了17%。這些實際應(yīng)用案例進(jìn)一步證明了GPT-4.1系列模型的強(qiáng)大性能和廣泛應(yīng)用前景。
然而,隨著GPT-4.1系列模型的發(fā)布,OpenAI產(chǎn)品命名的復(fù)雜性也進(jìn)一步加劇。ChatGPT目前已包含多種模型選項,如GPT-4o、GPT-4o mini、o1-pro等。OpenAI首席執(zhí)行官山姆·奧爾特曼早在2024年2月就承認(rèn)了命名問題,并計劃通過未來的GPT-5整合品牌,以緩解命名混亂。同時,OpenAI還計劃在2025年7月前逐步淘汰API中的GPT-4.5 Preview模型。
在價格方面,GPT-4.1模型每100萬tokens輸入費用為2美元(約合14.6元人民幣),每100萬tokens輸出費用為8美元(約合58.3元人民幣)。相較于GPT-4o,GPT-4.1在提供更強(qiáng)悍性能的同時,還便宜了26%。而GPT-4.1 nano則是OpenAI最便宜、最快的模型,為開發(fā)者提供了更為經(jīng)濟(jì)高效的解決方案。