近期,機器人技術(shù)領(lǐng)域迎來了一項突破性進展。機器人初創(chuàng)公司Figure AI正式推出了一種名為Helix的新型人工智能系統(tǒng),該系統(tǒng)能夠讓人形機器人通過語音指令完成一系列復(fù)雜的動作。Helix的亮相,標(biāo)志著機器人技術(shù)向更加智能化、自主化的方向邁出了重要一步。
Helix系統(tǒng)的核心在于其兩個高度集成的AI模塊。首先是一個具備70億參數(shù)的多模態(tài)語言模型,這一模型如同機器人的“智慧大腦”,能夠迅速處理來自語音和視覺的信息,處理頻率高達7至9赫茲。而另一個模塊則是一個擁有8000萬參數(shù)的AI系統(tǒng),它的主要任務(wù)是將語言模型輸出的指令轉(zhuǎn)化為具體的機器人動作,這一過程的處理頻率更是高達200赫茲。
這一系統(tǒng)使得機器人能夠同時控制35個自由度,從單個手指的精細動作到頭部、軀干的全方位移動,都實現(xiàn)了精準(zhǔn)的控制。為了展示Helix系統(tǒng)的強大功能,F(xiàn)igure AI發(fā)布了一系列演示視頻,視頻中機器人能夠響應(yīng)語音指令,準(zhǔn)確識別物體并進行抓取操作,展現(xiàn)了其出色的性能和實用性。
在官方公布的演示視頻中,兩臺搭載了Helix系統(tǒng)的機器人在一個模擬的廚房環(huán)境中協(xié)同工作,將食物放入冰箱,整個過程流暢自然,無需為任何物體進行特定的預(yù)先訓(xùn)練。這一場景展示了Helix系統(tǒng)在處理不同物體和任務(wù)時的靈活性和適應(yīng)性。
值得注意的是,Helix系統(tǒng)的訓(xùn)練數(shù)據(jù)量遠低于同類項目,僅需500小時的數(shù)據(jù)即可達到出色的表現(xiàn)。該系統(tǒng)還能夠在機器人內(nèi)置的嵌入式GPU上運行,這一特性使得Helix在商業(yè)應(yīng)用上更具可行性,為機器人的普及和廣泛應(yīng)用奠定了堅實基礎(chǔ)。
Figure AI的首席執(zhí)行官Brett Adcock表示,Helix系統(tǒng)的推出對于家用機器人的規(guī)模化應(yīng)用具有重要意義。與傳統(tǒng)機器人相比,Helix無需針對每個新任務(wù)進行重新編程,而是能夠輕松適應(yīng)新的情境和任務(wù)。盡管在實際應(yīng)用中,Helix的表現(xiàn)還需要進一步驗證,但其前景已經(jīng)引起了業(yè)界的廣泛關(guān)注和期待。
Figure AI近期結(jié)束了與OpenAI在機器人專用AI模型方面的合作。盡管OpenAI仍是Figure AI的重要投資方,但Brett Adcock在社交平臺上表示,大型語言模型(LLM)雖然越來越強大,但正在逐漸商品化,在Figure的戰(zhàn)略規(guī)劃中只占很小的一部分。目前,F(xiàn)igure正專注于開發(fā)自己的AI模型,以實現(xiàn)更高速度的機器人控制,特別是在實際環(huán)境中的應(yīng)用。
與此同時,OpenAI也在積極調(diào)整戰(zhàn)略方向,重新開始招募硬件工程師,以組建新的機器人團隊。此前,OpenAI的機器人部門曾被關(guān)閉,但此次重新組建團隊,顯示出OpenAI對于機器人技術(shù)的重視和未來發(fā)展的信心。