亞馬遜在人工智能領域邁出了重要一步,于近日正式揭曉了其通用人工智能智能體——Nova Act。這款智能體不僅能夠操控網絡瀏覽器,還能自主執行簡單的網絡任務,為用戶帶來前所未有的便捷體驗。
伴隨著Nova Act的發布,亞馬遜還推出了配套的軟件開發工具包(SDK),旨在助力開發者構建智能體應用原型。開發者可以通過訪問nova.amazon.com,輕松獲取這一工具包,并探索亞馬遜旗下的各類Nova基礎模型。
Nova Act由亞馬遜在舊金山新成立的AGI(通用人工智能)實驗室研發,該實驗室由前OpenAI研究員David Luan和Pieter Abbeel共同領導。據悉,Nova Act未來將為亞馬遜備受矚目的生成式AI增強版語音助手Alexa+提供關鍵功能支持。盡管目前開放的版本為“研究預覽版”,功能尚待完善,但其潛力已不容小覷。
亞馬遜表示,Nova Act SDK將賦予開發者自動化處理基礎性網絡操作的能力,如在線訂購餐飲、預訂餐廳晚餐等。通過這一工具包,AI智能體能夠輕松瀏覽網頁、填寫表單、選擇日歷日期等,大大提升了現有AI聊天機器人的實用性。
在性能方面,亞馬遜聲稱Nova Act在公司內部的多項測試中表現優異,超越了來自OpenAI和Anthropic的同類智能體。以ScreenSpot Web Text測試為例,Nova Act得分高達94%,而OpenAI的CUA和Anthropic的Claude 3.7 Sonnet分別得分為88%和90%。然而,值得注意的是,亞馬遜并未公布Nova Act在其他更常用的智能體評估基準上的測試結果。
對于為何一個以AGI為目標的實驗室會開發訂購沙拉的AI智能體,David Luan給出了他的見解。他認為,智能體是構建超智能AI系統的關鍵一步,而AGI則是一個能夠幫助人類在計算機上完成任何任務的AI系統。他強調,Nova Act SDK旨在可靠地自動化執行簡短、簡單的任務,并為開發者提供精確定義何時需要人類介入智能體工作流程的工具。
目前,市場上的早期AI智能體普遍面臨跨領域應用時可靠性不足的挑戰。這些系統往往運行緩慢,難以長時間獨立工作,且容易犯錯。因此,業界對亞馬遜是否找到了克服這些難題的有效方法充滿期待。Nova Act智能體能否在眾多競爭者中脫穎而出,市場將拭目以待。