近日,理想汽車發(fā)布下一代自動(dòng)駕駛架構(gòu)MindVLA。MindVLA是一個(gè)能與用戶溝通、理解用戶意圖的智能體,可以理解為是一名能聽懂用戶說(shuō)話的專職機(jī)器人司機(jī)。MindVLA是一種視覺(jué)-語(yǔ)言-行為大模型,是機(jī)器人大模型的新范式,它將空間智能、語(yǔ)言智能和行為智能統(tǒng)一在一個(gè)模型里。據(jù)悉,MindVLA將在7月份與理想i8同步推出,現(xiàn)款搭載英偉達(dá)雙Orin X芯片的車型也同樣能支持MindVLA。
MindVLA將為用戶帶來(lái)全新的產(chǎn)品形態(tài)和產(chǎn)品體驗(yàn),有MindVLA賦能的汽車是聽得懂、看得見、找得到的專職司機(jī)。“聽得懂”是用戶可以通過(guò)語(yǔ)音指令改變車輛的路線和行為,例如用戶在陌生園區(qū)尋找超市,只需要通過(guò)理想同學(xué)對(duì)車輛說(shuō):“帶我去找超市”,車輛將在沒(méi)有導(dǎo)航信息的情況下,自主漫游找到目的地;車輛行駛過(guò)程中,用戶還可以跟理想同學(xué)說(shuō):“開太快了”“應(yīng)該走左邊這條路”等,MindVLA能夠理解并執(zhí)行這些指令。
“看得見”是指MindVLA具備強(qiáng)大的通識(shí)能力,不僅能夠認(rèn)識(shí)星巴克、肯德基等不同的商店招牌,當(dāng)用戶在陌生地點(diǎn)找不到車輛時(shí),可以拍一張附近環(huán)境的照片發(fā)送給車輛,擁有MindVLA賦能的車輛能夠搜尋照片中的位置,并自動(dòng)找到用戶。
“找得到”意味著車輛可以自主地在地庫(kù)、園區(qū)和公共道路上漫游,其中典型應(yīng)用場(chǎng)景是用戶在商場(chǎng)地庫(kù)找不到車位時(shí),可以跟車輛說(shuō):“去找個(gè)車位停好”,車輛就會(huì)自主尋找車位,即便遇到死胡同,車輛也會(huì)自如地倒車,重新尋找合適的車位停下,整個(gè)過(guò)程不依賴地圖或?qū)Ш叫畔?,完全依賴MindVLA的空間理解和邏輯推理能力。
MindVLA利用Diffusion將Action Token解碼成優(yōu)化的軌跡,并通過(guò)自車行為生成和他車軌跡預(yù)測(cè)的聯(lián)合建模,提升了在復(fù)雜交通環(huán)境中的通行能力。面對(duì)部分長(zhǎng)尾場(chǎng)景,理想建立起人類偏好數(shù)據(jù)集,并且創(chuàng)新性地應(yīng)用RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))微調(diào)模型的采樣過(guò)程,最終使MindVLA能夠?qū)W習(xí)和對(duì)齊人類駕駛行為,顯著提升自動(dòng)駕駛系統(tǒng)的安全下限。
免責(zé)聲明:本文轉(zhuǎn)自網(wǎng)絡(luò),僅代表作者個(gè)人觀點(diǎn),與亞訊車網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容(包括圖片版權(quán)等問(wèn)題)未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。
買車、賣車就上亞訊車網(wǎng) hrvn.cn
汽車團(tuán)購(gòu) tg.yescar.cn,省心、省力、省錢!團(tuán)購(gòu)電話:400-6808097
關(guān)鍵詞:MindVLA,車輛,用戶,理想,可以
3月18日杭州,極氪舉辦的智駕發(fā)布會(huì)如期舉行,繼3月3日吉利發(fā)布高階
3月18日,從蔚來(lái)的第三個(gè)品牌firefly螢火蟲官方了解到,旗下首款小型
近日,從官方獲悉,小米汽車正式達(dá)成20萬(wàn)輛新車交付。本次交付的是一
近日,比亞迪海獅05 EV官圖發(fā)布,新車定位純電動(dòng)緊湊型SUV,全系標(biāo)配天
3月18日,從官方了解到,蔚來(lái)與寧德時(shí)代在福建寧德簽署戰(zhàn)略合作協(xié)議