導(dǎo)語:數(shù)據(jù)已經(jīng)成為了一種生產(chǎn)要素。
上海世博中心,2021世界人工智能大會剛剛落幕。
作為人工智能的重要應(yīng)用之一,自動駕駛也在這場一年一度的全球頂級會議期間大放異彩——
會議期間首次開展了面向大會觀眾基于開放道路的載人應(yīng)用體驗(yàn),體驗(yàn)路線總長 2.8 公里,共 12 個路口,途經(jīng)世博中心。此外,特定區(qū)域自動駕駛應(yīng)用展示也同步進(jìn)行。
自動駕駛動態(tài)體驗(yàn)線路
基于這些應(yīng)用體驗(yàn),國內(nèi)自動駕駛?cè)a(chǎn)業(yè)鏈成就和最高技術(shù)水平得以展示,自動駕駛技術(shù)對于人們?nèi)粘I钜约俺鲂蟹绞降母淖兛梢愿Q見。
事實(shí)上,自動駕駛系統(tǒng)平穩(wěn)運(yùn)轉(zhuǎn)的背后,是一個大家都耳熟能詳?shù)年P(guān)鍵詞——數(shù)據(jù)。
"數(shù)據(jù)已經(jīng)成為了一種生產(chǎn)要素,前提是要把人類世界的信息轉(zhuǎn)化為計算機(jī)可以識別的方式。"海天瑞聲的副總裁李科告訴新智駕。
想要打造真正安全可靠的量產(chǎn)自動駕駛產(chǎn)品、支持成千上萬輛同時交互的自動駕駛車輛,企業(yè)就必須想明白如何高效地收集以及有效利用海量數(shù)據(jù)。
那么,具體該怎么做呢?
盡管不像硬件一樣看得見摸得著,但無論是自動駕駛、輔助駕駛,還是智能座艙,這些被賦予智能屬性的駕駛體驗(yàn)都離不開數(shù)據(jù)的驅(qū)動。
在李科看來,通過訓(xùn)練數(shù)據(jù)生產(chǎn)的各個環(huán)節(jié)(設(shè)計、采集、加工、質(zhì)檢),可以收獲很多有益于智能駕駛算法模型迭代的規(guī)律和結(jié)論。
譬如關(guān)于駕駛員踩剎車的圖像數(shù)據(jù)
這個動作通常代表著判斷和決策的結(jié)果,那么在這個動作之前發(fā)生了什么?在這個動作之后發(fā)生了什么?有沒有比較特殊的事情發(fā)生?
再譬如關(guān)于艙內(nèi)語音交互的數(shù)據(jù)
語音交互時,哪些功能的啟動可能會對駕駛產(chǎn)生干擾?麥克風(fēng)如何排列可以更好地滿足各個座位上的交互需求?回聲噪聲的情況如何、該怎樣解決?
于自動駕駛企業(yè)和主機(jī)廠而言,這些數(shù)據(jù)都值得重點(diǎn)關(guān)注,因?yàn)樗鼈兒罄m(xù)可能有助于強(qiáng)化 Corner Case 的處理能力、優(yōu)化用戶的乘坐體驗(yàn)。
而計算機(jī)視覺和智能語音訓(xùn)練數(shù)據(jù)正是海天瑞聲從事了近二十年的領(lǐng)域,且已向微軟、亞馬遜、阿里等國內(nèi)外 500 多家知名企業(yè)提供從方案設(shè)計、數(shù)據(jù)采集、加工處理到質(zhì)檢交付的全流程數(shù)據(jù)服務(wù)。
其中,海天瑞聲在智能座艙的布局,最早可以追溯到 2005 年。這些歷程無疑為其積累了足夠多數(shù)據(jù)層面的 know-how,使得海天瑞聲可以基于自己的技術(shù)研發(fā)實(shí)力、經(jīng)驗(yàn)沉淀從數(shù)據(jù)角度去加速客戶的算法模型訓(xùn)練及商業(yè)化落地,相應(yīng)的也得到了越來越多智能駕駛客戶的青睞。
事實(shí)上,除了數(shù)據(jù)采集、標(biāo)注服務(wù),一個實(shí)力雄厚、經(jīng)驗(yàn)豐富的數(shù)據(jù)合作伙伴最重要的是幫助玩家們較為準(zhǔn)確地預(yù)估投入產(chǎn)出比,找到與整體業(yè)務(wù)目標(biāo)契合的解決方案。
對此,李科也嘗試通過一個例子來幫助理解。
在訓(xùn)練算法模型時,玩家們希望獲得某一場景中所有可能碰到的情況并以數(shù)據(jù)的形式給到機(jī)器去學(xué)習(xí),在智能駕駛業(yè)務(wù)中,這不僅包括常規(guī)的多種路況環(huán)境(擁堵、城市街道、高速路段),天氣狀況諸如大霧、暴風(fēng)雨雪天氣,不同光線條件例如白天、黑夜、清晨傍晚,還包括交通事故、違規(guī)行為等各種突發(fā)狀況。
智能駕駛艙外采集環(huán)境多樣、復(fù)雜
這就要求包括海天瑞聲在內(nèi)的數(shù)據(jù)服務(wù)商能夠深刻理解客戶的業(yè)務(wù)場景,在設(shè)計方案過程中考慮到算法對樣本多樣性的需求,以及不同樣本數(shù)據(jù)的占比應(yīng)該是怎樣的,同一類型場景的數(shù)據(jù)至少要達(dá)到多少才能滿足機(jī)器學(xué)習(xí)的需求,數(shù)據(jù)方案如何設(shè)計才能避免出現(xiàn)與模型的過擬合、欠擬合等諸多問題。
幫助客戶不在數(shù)據(jù)準(zhǔn)備階段走彎路,加速模型訓(xùn)練、產(chǎn)品落地和迭代是海天瑞聲堅守的初衷。
隨著智能駕駛更進(jìn)一步發(fā)展,在可預(yù)見的未來里,玩家們對底層數(shù)據(jù)處理能力的要求會越來越高、對長尾場景數(shù)據(jù)的需求會越來越大、對高質(zhì)量訓(xùn)練數(shù)據(jù)的訴求會越來越強(qiáng),智能駕駛的發(fā)展已成為不可逆轉(zhuǎn)的大趨勢,并且具備了進(jìn)一步落地應(yīng)用的充分條件。
然而這一領(lǐng)域鮮有高質(zhì)量的一站式數(shù)據(jù)服務(wù),整體的數(shù)據(jù)處理速度、精度、準(zhǔn)度都還有待提升,尤其是 3D 點(diǎn)云數(shù)據(jù)。
因?yàn)檫h(yuǎn)見,海天瑞聲早已開始思考如何將自己在數(shù)據(jù)處理方面的先發(fā)優(yōu)勢最大化發(fā)揮,去幫助玩家們解決痛點(diǎn)。據(jù)了解,目前海天瑞聲的技術(shù)已經(jīng)能夠支持 3D 點(diǎn)云標(biāo)注、3D 點(diǎn)云連續(xù)幀標(biāo)注、3D 連續(xù)幀與 2D 聯(lián)合的標(biāo)注、3D 語義分割等。
譬如,針對同一物體在不同空間中的數(shù)據(jù)處理,海天瑞聲前期會對其進(jìn)行多個坐標(biāo)系的建模和配準(zhǔn),然后經(jīng)過校準(zhǔn)后投影到同一個坐標(biāo)系中,最終保障不同空間中的標(biāo)注結(jié)果的統(tǒng)一。
對于 3D & 2D 的聯(lián)合標(biāo)注,海天瑞聲能夠通過算法實(shí)現(xiàn) 3D 標(biāo)注結(jié)果自動投影到 2D 平面,隨之自動生成對應(yīng)目標(biāo)的空間位置。
可以看到,得益于強(qiáng)勁的技術(shù)實(shí)力以及在數(shù)據(jù)服務(wù)領(lǐng)域耕耘的經(jīng)驗(yàn),即便是在新興的且難度較大的 3D 點(diǎn)云數(shù)據(jù)處理方面,海天瑞聲也已經(jīng)做得游刃有余。
在艙內(nèi)場景,DMS 數(shù)據(jù)因?yàn)樯婕暗焦饩€、多角度同步等不同要求,大大加劇了采集的難度。海天瑞聲則基于自研的多通道桌面車載錄音工具,配合不同采集設(shè)備,從采集端實(shí)現(xiàn)多通道同步,且支持靈活參數(shù)設(shè)置和實(shí)時語音質(zhì)檢,在提高采集效率的同時還能夠?qū)崟r監(jiān)控采集質(zhì)量。
艙內(nèi)多通道采集示例
種種這些,都是海天瑞聲區(qū)別于業(yè)內(nèi)其他數(shù)據(jù)服務(wù)商的根源,也是在經(jīng)年累月的努力下為自己打造的深厚壁壘,使其得以領(lǐng)跑智能駕駛數(shù)據(jù)服務(wù)。
隨著行業(yè)的高速發(fā)展,千差萬別的需求背后,不變的是對數(shù)據(jù)合規(guī)及安全的要求。作為行業(yè)的領(lǐng)路人,海天瑞聲穩(wěn)步前行的同時也持續(xù)加碼在合規(guī)及安全方面的建設(shè)。
其業(yè)內(nèi)首創(chuàng)科學(xué)的項(xiàng)目管理體系,從資源的合規(guī)性、數(shù)據(jù)存儲安全及流轉(zhuǎn)等方面制定了詳盡的措施:
比如,所有項(xiàng)目采集前必須獲得被采集人的書面授權(quán),否則需要重新配置資源以保障合規(guī)性;
同時,海天瑞聲還專門設(shè)立了進(jìn)行數(shù)據(jù)安全及合規(guī)性審核的數(shù)據(jù)保護(hù)官(以下簡稱"DPO");并且通過完善的制度條例充分保障被采集人的權(quán)利,曾經(jīng)有一位海外被采集人在項(xiàng)目結(jié)束后申請刪除個人數(shù)據(jù)信息并撤回相應(yīng)授權(quán),收到請求的DPO第一時間整理了相關(guān)資料后與客戶聯(lián)系,協(xié)商操作,最終在24小時內(nèi)完成了被采集人的訴求;
2018年5月由歐盟出臺的《通用數(shù)據(jù)保護(hù)條例》,被稱為史上"最嚴(yán)數(shù)據(jù)保護(hù)法案",曾因?yàn)閿?shù)據(jù)信息保護(hù)失職對英航開出了15.8億人民幣的天價罰單。值得一提的是,此法案一經(jīng)出臺,就被海天瑞聲納入了項(xiàng)目及技術(shù)研發(fā)人員的"必修課",組織學(xué)習(xí)并進(jìn)行考核;
…
除了制度上的嚴(yán)格規(guī)范,一向以技術(shù)嚴(yán)謹(jǐn)而著稱的海天瑞聲自然也有相應(yīng)的"硬實(shí)力"去保障數(shù)據(jù)安全,即一體化數(shù)據(jù)處理平臺:
該平臺是海天瑞聲基于自身近20年數(shù)據(jù)服務(wù)經(jīng)驗(yàn),并融合了數(shù)十項(xiàng)核心技術(shù)及專利打磨而成。平臺內(nèi)上千個自研標(biāo)注工具聯(lián)合打通,不僅可以用來處理復(fù)雜的交叉業(yè)務(wù)場景數(shù)據(jù),更重要的是保證了數(shù)據(jù)從采集到脫敏、清洗、標(biāo)注、質(zhì)檢等全流程不出平臺即可完成,與平臺內(nèi)嚴(yán)格的人員權(quán)限管理、實(shí)時監(jiān)控等功能一起,充分保障了數(shù)據(jù)的安全可控。
此外,還支持私有部署、駐場標(biāo)注等一系列高級別數(shù)據(jù)安全處理請求。
以上種種舉措,使得海天瑞聲很早就通過ISO/IEC 27001管理體系認(rèn)證,并于日前獲得具有"最嚴(yán)苛資質(zhì)審核"稱號的ISO/IEC 27701隱私保護(hù)標(biāo)準(zhǔn)認(rèn)證。
數(shù)據(jù)的合規(guī)安全是客戶的重要訴求,也是海天瑞聲牢牢堅守的生命線。
縱觀行業(yè)的發(fā)展,智能駕駛已經(jīng)成為了全球大多數(shù)國家和地區(qū)都在推進(jìn)的主旋律,這個市場的規(guī)模還將呈倍數(shù)增大。
對此,李科向新智駕表示,現(xiàn)在一些造車新勢力發(fā)展勢頭迅猛,這會進(jìn)一步帶動艙外感知的數(shù)據(jù)需求,我們今年在持續(xù)發(fā)力艙內(nèi)的同時,會側(cè)重艙外的布局。
事實(shí)上,無論艙內(nèi)還是艙外,與這些場景結(jié)合的技術(shù)大多離不開智能語音、計算機(jī)視覺和自然語言理解——這些也是海天瑞聲一直在耕耘、也會堅持耕耘的方向。正如李科所介紹的,從 2005 年開始,海天瑞聲就開始在AI全核心領(lǐng)域進(jìn)行深度的數(shù)據(jù)布局。
如今十六年過去,海天瑞聲已然立于數(shù)據(jù)服務(wù)行業(yè)的高山之巔。
全球語言學(xué)家團(tuán)隊(duì)、 超過 160 語種方言服務(wù)能力、覆蓋全球近 1/2 國家及地區(qū)的本地化項(xiàng)目經(jīng)驗(yàn)、760 余個自有知識產(chǎn)權(quán)的訓(xùn)練數(shù)據(jù)產(chǎn)品等,這些均是海天瑞聲長期以來堅持創(chuàng)新和自主研發(fā)的果實(shí)——不僅可以助其在火熱的智能駕駛賽道大展身手,加速海內(nèi)外自動駕駛以及智能座艙的應(yīng)用落地;也能夠作為海天瑞聲發(fā)展的核心代名詞,成為自身多項(xiàng)業(yè)務(wù)延續(xù)和拓展的重要基礎(chǔ)。
無論從何種角度來看,用戶驅(qū)動、需求驅(qū)動、實(shí)戰(zhàn)驅(qū)動都是推動海天瑞聲持續(xù)穩(wěn)步前進(jìn)的動能。也只有通過這些方式打造出來的產(chǎn)品,才接地氣、才具有真正的生命力。(來源:雷鋒網(wǎng))
免責(zé)聲明:本文轉(zhuǎn)自網(wǎng)絡(luò),僅代表作者個人觀點(diǎn),與亞訊車網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容(包括圖片版權(quán)等問題)未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。
買車、賣車就上亞訊車網(wǎng) hrvn.cn
汽車團(tuán)購 tg.yescar.cn,省心、省力、省錢!團(tuán)購電話:400-6808097
關(guān)鍵詞:數(shù)據(jù),海天,駕駛,智能,采集
近日,國家發(fā)改委宣布,新一輪成品油調(diào)價窗口將于4月1日24時開啟。
近日,從官方獲悉,特斯拉Model 3和Model Y的星空灰車漆即日起可免費(fèi)
近日,iCAR發(fā)布了新車型V23的一組最新預(yù)告圖,相較此前發(fā)布的預(yù)告圖
近日,F(xiàn)F創(chuàng)始人賈躍亭在社交媒體上公開質(zhì)疑小米汽車。
近日,福特中國官方宣布,賈鳴鏑博士即日起接替朱梅君女士出任林肯中