近期,OpenAI 宣布了一項備受矚目的計劃,即在今年夏季初推出自 GPT-2 之后的首個開源語言模型。這一消息引發(fā)了業(yè)界的廣泛關(guān)注,關(guān)于該模型的細節(jié)也逐漸被披露。
據(jù)知情人士透露,OpenAI 研究副總裁 Aidan Clark 正親自掛帥,領(lǐng)導這一開源模型的開發(fā)工作。盡管仍處于早期階段,但公司對該模型寄予厚望,期望其在推理能力上能夠超越現(xiàn)有的開源推理模型。值得注意的是,該模型將采用極為寬松的許可協(xié)議,幾乎不對使用或商業(yè)化設(shè)置任何限制,這一舉措顯然是為了避免像 Llama 和谷歌的 Gemma 等開源模型因限制過多而引發(fā)的社區(qū)爭議。
OpenAI 此舉的背景是,近年來面臨著來自競爭對手的巨大壓力。中國的 DeepSeek 等公司采用開源策略,迅速取得了顯著成功。這些競爭對手將模型提供給 AI 社區(qū)進行實驗,甚至允許商業(yè)化使用,這一策略已被證明極為有效。例如,meta 在其 Llama 系列開源 AI 模型上投入巨大,并宣布該系列模型的下載量已超過 10 億次。DeepSeek 也迅速積累了大量全球用戶,并吸引了國內(nèi)投資者的廣泛關(guān)注。
據(jù)了解,OpenAI 的開源模型將采用“輸入文本,輸出文本”的模式,并可能允許開發(fā)者自由開啟或關(guān)閉其“推理”功能。雖然開啟推理功能可以提高模型的準確性,但也會增加延遲。如果此次發(fā)布反響良好,OpenAI 可能會繼續(xù)推出更多模型,包括更小型的版本,以滿足不同用戶的需求。
然而,OpenAI 首席執(zhí)行官 Sam Altman 此前曾在公開場合表示,他認為 OpenAI 在開源技術(shù)方面“站在了歷史的錯誤一邊”。他在一次 Reddit 問答中坦言:“我個人認為我們需要制定不同的開源策略。但并非 OpenAI 的每個人都認同這一觀點,這也不是我們當前的首要任務。”盡管如此,OpenAI 仍然決定推出這一開源模型,并計劃對其進行嚴格的“紅隊測試”和安全評估。
為了確保模型的安全性和可靠性,OpenAI 計劃為該模型發(fā)布一份詳細的技術(shù)報告,即模型卡。這份報告將展示 OpenAI 內(nèi)部和外部的基準測試及安全測試結(jié)果,以便用戶了解模型的性能和潛在風險。Altman 在上個月的一篇帖子中表示:“在發(fā)布之前,我們將根據(jù)我們的準備框架評估這一模型,就像對待其他任何模型一樣。鑒于我們知道該模型在發(fā)布后可能會被修改,我們還將進行額外的工作。”
然而,OpenAI 在模型安全測試方面的做法也引發(fā)了一些 AI 倫理學家的批評。有批評指出,OpenAI 在對近期模型進行安全測試時顯得過于匆忙,且未公布其他模型的模型卡。Altman 還被指控在 2023 年 11 月短暫被解職之前,誤導了 OpenAI 高管關(guān)于模型安全審查的情況。這些爭議無疑給 OpenAI 的開源計劃增添了一些不確定性。