近日,全球領(lǐng)先的AI研究機(jī)構(gòu)OpenAI宣布了一項(xiàng)新的API服務(wù)——“Flex處理模式”,旨在為用戶在與谷歌等生成式AI巨頭的競(jìng)爭(zhēng)中提供更具成本效益的解決方案。據(jù)TechCrunch報(bào)道,F(xiàn)lex處理模式通過(guò)犧牲一定的響應(yīng)速度和偶爾的資源分配問(wèn)題,換取了模型使用價(jià)格的顯著降低。
OpenAI透露,F(xiàn)lex處理模式目前正對(duì)新發(fā)布的o3和o4-mini推理模型進(jìn)行開(kāi)放測(cè)試。這些測(cè)試主要面向一些優(yōu)先級(jí)較低的“非生產(chǎn)”任務(wù),如模型評(píng)估、數(shù)據(jù)擴(kuò)充和異步處理等。這一新服務(wù)的推出,無(wú)疑為那些希望在不影響核心業(yè)務(wù)的前提下,探索AI潛能的用戶提供了更多選擇。
具體而言,采用Flex處理模式的用戶將享受到API費(fèi)用直接減半的優(yōu)惠。以o3模型為例,在Flex模式下,每百萬(wàn)輸入tokens的費(fèi)用從原來(lái)的10美元降至5美元(按當(dāng)前匯率約合36.5元人民幣,相當(dāng)于約75萬(wàn)字),每百萬(wàn)輸出tokens的費(fèi)用則從40美元降至20美元(約合146元人民幣)。而對(duì)于更輕量級(jí)的o4-mini模型,F(xiàn)lex模式下的費(fèi)用更是從每百萬(wàn)輸入tokens的1.10美元和每百萬(wàn)輸出tokens的4.40美元,分別降至0.55美元(約合4元人民幣)和2.20美元(約合16.1元人民幣)。
OpenAI還通知客戶,為了進(jìn)一步優(yōu)化服務(wù),公司將實(shí)施新的身份驗(yàn)證流程。根據(jù)用戶的消費(fèi)層級(jí),第1至第3層的開(kāi)發(fā)者在完成新上線的身份驗(yàn)證流程后,才能獲得o3模型的訪問(wèn)權(quán)限。同時(shí),o3及其他模型的推理摘要功能和流式API服務(wù)也需要在完成身份驗(yàn)證后才能啟用。這一舉措旨在防止用戶違反公司制定的使用政策,確保服務(wù)的合規(guī)性和穩(wěn)定性。
OpenAI表示,F(xiàn)lex處理模式的推出,是公司持續(xù)加大在生成式AI領(lǐng)域投入的一部分。通過(guò)提供更加靈活和經(jīng)濟(jì)的解決方案,OpenAI希望能夠幫助更多用戶探索AI的無(wú)限可能,推動(dòng)AI技術(shù)的普及和發(fā)展。
值得注意的是,盡管Flex處理模式在響應(yīng)速度和資源分配上可能存在一定的不確定性,但對(duì)于那些對(duì)價(jià)格敏感且能夠容忍一定延遲的用戶來(lái)說(shuō),這無(wú)疑是一個(gè)極具吸引力的選擇。通過(guò)降低使用成本,F(xiàn)lex處理模式有望吸引更多用戶嘗試和使用OpenAI的先進(jìn)AI模型,進(jìn)一步推動(dòng)AI技術(shù)的創(chuàng)新和應(yīng)用。
隨著生成式AI技術(shù)的不斷發(fā)展,OpenAI與谷歌等競(jìng)爭(zhēng)對(duì)手之間的較量也日益激烈。Flex處理模式的推出,不僅展示了OpenAI在技術(shù)創(chuàng)新和服務(wù)優(yōu)化方面的實(shí)力,也為其在激烈的市場(chǎng)競(jìng)爭(zhēng)中贏得了更多優(yōu)勢(shì)。未來(lái),OpenAI將繼續(xù)致力于推動(dòng)AI技術(shù)的突破和應(yīng)用,為用戶創(chuàng)造更多價(jià)值。
同時(shí),OpenAI也提醒用戶,在使用Flex處理模式時(shí),應(yīng)充分了解其特點(diǎn)和限制,并根據(jù)自身需求合理選擇使用方式。通過(guò)合理規(guī)劃和管理資源,用戶可以在保證業(yè)務(wù)穩(wěn)定的前提下,充分利用AI技術(shù)的優(yōu)勢(shì),提升工作效率和創(chuàng)新能力。