在英偉達(dá)GTC 2025技術(shù)大會上,理想汽車自動駕駛領(lǐng)域的領(lǐng)軍人物賈鵬,向與會者展示了其最新的自動駕駛技術(shù)成果——MindVLA。這是一次深度的技術(shù)分享,主題名為《VLA:自動駕駛邁向物理智能體的關(guān)鍵跨越》。
MindVLA,一個(gè)集視覺、語言與行為于一體的先進(jìn)大模型,代表了機(jī)器人大模型的新方向。它不僅融合了空間智能、語言智能與行為智能,還賦予模型卓越的3D空間理解能力、邏輯推理能力和行為生成能力。這種技術(shù)的突破,意味著自動駕駛系統(tǒng)不再僅僅是對環(huán)境的被動反應(yīng),而是能夠感知、思考并主動適應(yīng)環(huán)境,從而提供更加智能和人性化的駕駛體驗(yàn)。
賈鵬的演講中,MindVLA被描繪為一個(gè)既能與用戶進(jìn)行順暢溝通、理解用戶意圖的智能體,又能作為“聽得懂、看得見、找得到”的專業(yè)司機(jī),為乘客帶來前所未有的駕駛與乘坐體驗(yàn)。這一技術(shù)的實(shí)現(xiàn),標(biāo)志著自動駕駛技術(shù)向更高層次的智能化邁進(jìn)。
在更早前的2025年第一季度財(cái)報(bào)電話會議上,理想汽車的創(chuàng)始人兼CEO李想曾分享了他對自動駕駛技術(shù)的看法。他形象地比喻低階自動駕駛?cè)缤ハx或低等動物開車,而“端到端 + VLM”技術(shù)則類似猴子開車,仍需要人類的輔助。李想提到,理想汽車在2024年10月推出的“端到端 + VLM”智駕系統(tǒng),并在今年1月通過OTA7.0更新實(shí)現(xiàn)了全城市覆蓋的端到端功能,但他對此仍表示不滿,認(rèn)為“端到端”和“VLM”分別屬于不同的腦系統(tǒng),且功能尚不夠強(qiáng)大。
李想進(jìn)一步闡述了理想汽車的愿景,即成為AGI(人工智能通用智能體)時(shí)代的終端企業(yè),就像手機(jī)時(shí)代的蘋果一樣。他預(yù)測,未來的AGI機(jī)器人將包括L4級別的自動駕駛空間機(jī)器人、與人合體增強(qiáng)能力的機(jī)器人以及人形機(jī)器人。這些機(jī)器人將像蘋果設(shè)備一樣,實(shí)現(xiàn)生態(tài)互聯(lián)、功能互補(bǔ),而理想汽車則希望像AGI終端機(jī)器人那樣,具備全面的感知、決策、推理、執(zhí)行及反饋能力。