在科技界的萬眾矚目下,OpenAI于4月17日凌晨通過一場直播活動,震撼發布了其o系列推理模型家族的兩位新成員——o3與o4-mini。據OpenAI官方宣稱,這兩款模型代表了他們迄今為止在智能領域的巔峰之作,它們不僅能夠更深入地思考問題,還在響應速度上實現了顯著提升。
尤為引人注目的是,o3與o4-mini在工具使用上的智能表現令人贊嘆。它們能夠無縫集成ChatGPT內的各種工具,包括但不限于網絡搜索、Python數據分析、視覺信息深度解析,甚至圖像生成。這些模型經過特殊訓練,能夠自主判斷何時、以何種方式運用這些工具,從而在極短時間內(通常不足一分鐘)給出詳盡且經過深思熟慮的答案,解決復雜問題。
尤為o3與o4-mini是OpenAI首次推出的具備“圖像思考”能力的模型。用戶只需上傳白板照片、教科書圖表或手繪草圖,即便圖像質量欠佳,這兩款模型也能準確解讀并進行深入分析。更令人驚嘆的是,它們還能實時對圖像進行旋轉、縮放等操作,以輔助推理過程。
在性能表現上,o3無疑成為了OpenAI當前最強大的推理模型,其在編碼、數學、科學、視覺感知等多個領域均展現出領先實力。而o4-mini則以其小巧、高效的特點,專為追求速度與成本效益的推理任務而設計。在基準測試中,o3與o4-mini在數學、編碼及視覺任務上的卓越表現令人矚目。
除了卓越的推理能力,o3與o4-mini在有害提示的拒絕方面也展現出了高超技巧。OpenAI在訓練數據中融入了新的拒絕提示,并在系統層面開發了緩解措施,以有效標記潛在風險領域的危險提示。通過訓練一個推理LLM監控器,該監控器能夠從人類編寫的可解釋安全規范中工作,當應用于生物風險領域時,成功標記了約99%的對話。
在用戶權限方面,ChatGPT Plus、Pro和Team用戶將率先體驗到o3、o4-mini及o4-mini-high,這些新模型將替代原有的o1、o3-mini及o3-mini-high。而ChatGPT Enterprise和Edu用戶則將在一周后獲得訪問權限。對于免費用戶而言,他們可以在提交查詢前選擇“思考”功能,嘗試使用o4-mini。值得注意的是,所有計劃中的速率限制均保持不變。
此次更新不僅標志著OpenAI在模型發展上的重要里程碑,也預示著未來ChatGPT將朝著更智能、更獨立執行任務的方向邁進。通過將o系列的專業推理能力與GPT系列的自然對話及工具使用能力相結合,OpenAI正逐步構建一個更加全面、強大的AI生態系統。