日前,百度宣布百度Create大會(暨百度AI開發(fā)者大會)將于1月10日舉辦。據(jù)悉,百度已連續(xù)第五年舉辦Create大會,今年的Create大會將依舊在百度希壤元宇宙中呈現(xiàn),分享百度在人工智能、自動(dòng)駕駛、智能交通、智能搜索、量子計(jì)算、人工智能科學(xué)計(jì)算等領(lǐng)域的最新進(jìn)展與思考。
在Create大會正式召開之前,百度展示了如何用“手機(jī)全雙工語音交互”改善使用導(dǎo)航應(yīng)用的體驗(yàn),還詳細(xì)介紹了如何用“上帝視角”提升汽車的自動(dòng)駕駛能力,以及百度自研的深度學(xué)習(xí)平臺飛槳在科研領(lǐng)域的運(yùn)用。
業(yè)內(nèi)首發(fā)全雙工語音交互技術(shù)
以實(shí)際使用場景為例,當(dāng)用戶駕駛車輛時(shí)使用地圖導(dǎo)航,一般會借助時(shí)播放的導(dǎo)航語音認(rèn)路。當(dāng)環(huán)境音比較嘈雜,而用戶需要修改路線的時(shí)候,語音可能會識別不請。它的原理也不難理解,如果手機(jī)App在說話的時(shí)候,又在聽,它可能會識別自己說的話,非常容易造成誤判。
百度語音首席架構(gòu)師賈磊解釋說,很長一段時(shí)間,都沒有一個(gè)方案能普適的支持在手機(jī)上實(shí)現(xiàn)全雙工的語音交互——在手機(jī)播放導(dǎo)航提示的同時(shí),也能夠聽清我們的指令,甚至像真人對話一樣可以被我們隨時(shí)打斷,并對新的語音指令給予反饋。
理論上講,想要實(shí)現(xiàn)全雙工語音交互,必須先做回聲消除,避免手機(jī)終端識別自己播放的聲音。賈磊說,在前裝軟件的音箱、車載系統(tǒng)上比較容易實(shí)現(xiàn),可以通過硬件適配算法,提前保證回聲消除的效果。
而手機(jī)App屬于純軟件后裝方案,需要讓軟件算法適配不同型號的終端硬件。通常,手機(jī)上喇叭距離麥克風(fēng)的距離比較近,同時(shí)手機(jī)終端款式多,硬件參差不齊。這些因素疊加在一起,會導(dǎo)致聲音信號的回聲消除會出現(xiàn)各種各樣的問題。再加上手機(jī)硬件的迭代更新非常快速,回聲消除效果就更加難以保證了。
百度的技術(shù)團(tuán)隊(duì)融合傳統(tǒng)信號處理和深度學(xué)習(xí)模型各自的優(yōu)點(diǎn),基于語音識別目標(biāo),端到端地進(jìn)行回聲消除和信號增強(qiáng),解決了手機(jī)場景下的回聲消除問題,即使手機(jī)音量開到最大,回聲消除量也能達(dá)到40分貝,使得手機(jī)APP的語音識別功能能夠正常工作。
據(jù)介紹,這是第一個(gè)能在手機(jī)上實(shí)現(xiàn)純軟件方案回聲消除的技術(shù)。這個(gè)技術(shù)的實(shí)現(xiàn)讓讓人機(jī)交互更智能順暢,更逼近人與人直接交互的體驗(yàn)。目前,百度已經(jīng)計(jì)劃將全雙工語音交互運(yùn)用到更多場景中,比如智能汽車。
車路一體的UniBEV解決方案
在近日的溝通會上,百度還展示了自動(dòng)駕駛車路一體解決方案UniBEV。
據(jù)了解,近幾年來,有的車企推出了BEV(Bird's Eye View,視覺為中心的俯視圖)自動(dòng)駕駛感知方案。據(jù)介紹,BEV自動(dòng)駕駛感知就好比是一個(gè)從高處統(tǒng)觀全局的“上帝視角”,車上多個(gè)傳感器采集的數(shù)據(jù),會輸入到一個(gè)統(tǒng)一模型進(jìn)行整體分析推理生成鳥瞰圖,能有效地避免誤差疊加;這種方案還能夠做到時(shí)序融合,不僅是收集一個(gè)時(shí)刻的數(shù)據(jù),分析一個(gè)時(shí)刻的數(shù)據(jù),而是支持把過去一個(gè)時(shí)間片段中的數(shù)據(jù)都融合進(jìn)模型做環(huán)境感知建模,時(shí)序信息的引入讓感知到的結(jié)果更穩(wěn)定,使得車輛對于道路情況的判斷更加準(zhǔn)確、讓自動(dòng)駕駛更安全。
而百度基于BEV基礎(chǔ)上,提出了UniBEV車路一體的解決方案。它集成了車端多相機(jī)、多傳感器的在線建圖、動(dòng)態(tài)障礙物感知,以及路側(cè)視角下的多路口多傳感器融合等任務(wù),是業(yè)內(nèi)首個(gè)車路一體的端到端感知解決方案。
基于統(tǒng)一的BEV空間,UniBEV 車路一體大模型更容易實(shí)現(xiàn)多模態(tài)、多視角、多時(shí)間上的時(shí)空特征融合。百度借助大數(shù)據(jù)+大模型+小型化技術(shù)閉環(huán),在車端路側(cè)的動(dòng)靜態(tài)感知端有更大的優(yōu)勢。
此外,百度還展示了飛槳團(tuán)隊(duì)的最新成果:推出了超大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù)PGLBox,是業(yè)界首個(gè)同時(shí)支持復(fù)雜算法+超大圖+超大離散模型的大規(guī)模圖學(xué)習(xí)訓(xùn)練技術(shù),通過顯存、內(nèi)存、SSD三級存儲技術(shù)和訓(xùn)練框架的性能優(yōu)化技術(shù),單機(jī)即可支持百億節(jié)點(diǎn)、數(shù)百億邊的圖采樣和訓(xùn)練,并可通過多機(jī)擴(kuò)展支持更大規(guī)模。據(jù)悉飛槳目前已經(jīng)在百度的智能交通、信息推薦、搜索等標(biāo)桿場景實(shí)現(xiàn)落地,大幅提升業(yè)務(wù)效率和用戶體驗(yàn)。
免責(zé)聲明:本文轉(zhuǎn)自網(wǎng)絡(luò),僅代表作者個(gè)人觀點(diǎn),與亞訊車網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容(包括圖片版權(quán)等問題)未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。
買車、賣車就上亞訊車網(wǎng) hrvn.cn
汽車團(tuán)購 tg.yescar.cn,省心、省力、省錢!團(tuán)購電話:400-6808097
關(guān)鍵詞:百度,手機(jī),語音,技術(shù),消除
據(jù)寧德市應(yīng)急管理局消息,9月29日11時(shí)許,位于福建寧德市的寧德時(shí)代Z
9月29日,蔚來公司宣布與蔚來控股有限公司(以下簡稱:蔚來中國)的三家
近日,吉利汽車集團(tuán)CE0淦家閱在2024世界新能源汽車大會上透露:年內(nèi)
近日,從官方獲悉,哪吒汽車純電中型SUV——哪吒X在印尼雅加達(dá)正式上
近日,阿維塔07正式開啟交付,阿維塔科技總裁陳卓現(xiàn)場為車主交付。阿