午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费

資訊在沃

銀河通用攜手多家機構(gòu)發(fā)布GraspVLA,開啟端到端具身抓取新時代

   發(fā)布時間:2025-01-10 15:26 作者:顧青青

近日,銀河通用攜手北京智源人工智能研究院(BAAI)、北京大學(xué)及香港大學(xué)的科研團隊,共同發(fā)布了一款名為GraspVLA的突破性大模型。這款模型專注于具身智能領(lǐng)域,旨在通過人工智能技術(shù)的深度融入,使機器人等物理實體具備感知、學(xué)習(xí)和與環(huán)境動態(tài)交互的能力。

GraspVLA大模型的構(gòu)建過程包括預(yù)訓(xùn)練和后訓(xùn)練兩個階段。其預(yù)訓(xùn)練階段完全基于海量的合成大數(shù)據(jù),數(shù)據(jù)量之巨前所未有,達到了十億幀“視覺-語言-動作”對。這一龐大的數(shù)據(jù)集使模型掌握了泛化閉環(huán)抓取能力,奠定了堅實的基礎(chǔ)。

經(jīng)過預(yù)訓(xùn)練的GraspVLA模型,能夠直接實現(xiàn)從模擬環(huán)境到現(xiàn)實環(huán)境的無縫遷移。在未見過的真實場景和物體上,模型無需任何先驗知識即可進行測試,并展現(xiàn)出強大的泛化能力,滿足了大多數(shù)產(chǎn)品的實際需求。對于特定場景下的特殊需求,后訓(xùn)練階段僅需少量樣本學(xué)習(xí),即可將基礎(chǔ)能力遷移至特定場景,既保持了高泛化性,又形成了符合產(chǎn)品需求的專業(yè)技能。

為了驗證GraspVLA模型的泛化能力,官方提出了七大“金標準”,包括光照泛化、背景泛化、平面位置泛化、空間高度泛化、動作策略泛化、動態(tài)干擾泛化和物體類別泛化。這些標準全面覆蓋了機器人抓取任務(wù)中可能遇到的各種復(fù)雜情況。

在光照泛化測試中,模型在不同光照條件下均能保持穩(wěn)定的抓取性能。背景泛化測試中,模型在復(fù)雜多變的背景下依然能夠準確識別目標物體。平面位置泛化和空間高度泛化測試中,模型能夠靈活應(yīng)對不同位置和高度的目標物體。動作策略泛化測試中,模型展現(xiàn)了多樣化的抓取策略。動態(tài)干擾泛化測試中,模型在動態(tài)環(huán)境中依然能夠準確抓取目標。物體類別泛化測試中,模型對不同類別的物體均展現(xiàn)出了良好的抓取能力。

GraspVLA大模型的發(fā)布,標志著具身智能領(lǐng)域取得了重大進展。它不僅提升了機器人在復(fù)雜環(huán)境中的抓取能力,還為未來人工智能與物理實體的深度融合奠定了堅實基礎(chǔ)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新