Anthropic,作為OpenAI的強(qiáng)勁對(duì)手,近期揭曉了Claude 3.5的重大升級(jí),其中Claude 3.5 Sonnet模型尤為引人注目,該模型能夠模擬人類(lèi)操作電腦的方式。
通過(guò)Anthropic新推出的API,Claude 3.5 Sonnet能夠感知并與計(jì)算機(jī)界面互動(dòng),包括光標(biāo)移動(dòng)、屏幕點(diǎn)擊及虛擬鍵盤(pán)輸入,這一創(chuàng)新得益于API的集成,使開(kāi)發(fā)者能將用戶指令轉(zhuǎn)換為計(jì)算機(jī)可執(zhí)行的操作。
在OSWorld基準(zhǔn)測(cè)試中,Claude 3.5 Sonnet僅憑截圖便獲得了14.9%的得分,遠(yuǎn)超第二名的7.8%。而在允許更多步驟完成任務(wù)的情況下,其得分雖未達(dá)到人類(lèi)水平,但仍以22.0%的成績(jī)實(shí)現(xiàn)了AI領(lǐng)域的一大突破。
Anthropic指出,目前該功能操作速度較慢且存在錯(cuò)誤,但作為測(cè)試階段,主要目標(biāo)是收集開(kāi)發(fā)者反饋,以便持續(xù)優(yōu)化。