日期時(shí)間:
智加科技崔迪瀟:打磨安全的干線物流自動(dòng)駕駛
責(zé)編:李曉燕 發(fā)布時(shí)間:2020-05-21 10:56:58 瀏覽次數(shù):

圖片21.jpg


   

   如今,無論是中國(guó),還是美國(guó),物流市場(chǎng)的規(guī)模都已達(dá)萬億級(jí)別,而且,市場(chǎng)規(guī)模都還在不斷擴(kuò)大。毫無疑問,這是一個(gè)擁有無限潛力的市場(chǎng)。
       然而,這一市場(chǎng)正在面臨尷尬的局面——巨大的就業(yè)缺口、高昂的運(yùn)營(yíng)成本、頻發(fā)的駕駛安全事故,這些都成為當(dāng)代物流行業(yè)亟待解決的痛點(diǎn)。
       近日,雷鋒網(wǎng)邀請(qǐng)了智加科技高級(jí)主任科學(xué)家崔迪瀟來進(jìn)行業(yè)內(nèi)分享。以下為崔迪瀟演講內(nèi)容,雷鋒網(wǎng)進(jìn)行了不改變?cè)獾恼恚?br />        大家晚上好,我是來自智加科技的崔迪瀟。
       我今天分享的主題是打磨安全的干線物流自動(dòng)駕駛,會(huì)分享智加過去在干線物流自動(dòng)駕駛領(lǐng)域的實(shí)踐,以及智加對(duì)技術(shù)落地的思考和推演。
       主要的內(nèi)容分為四個(gè)版塊:

     當(dāng)前干線物流的現(xiàn)狀和自動(dòng)駕駛的機(jī)遇;

   •  自動(dòng)駕駛落地應(yīng)用的 5 個(gè)階段;

   •  干線物流自動(dòng)駕駛的關(guān)鍵技術(shù)和挑戰(zhàn);

   •  L2+ 到 L4 級(jí)所面臨的數(shù)據(jù)閉環(huán)問題。
       一、當(dāng)前干線物流的現(xiàn)狀和自動(dòng)駕駛的機(jī)遇
       物流在國(guó)家經(jīng)濟(jì)的組成部分中占重要位置,尤其在中美兩地,物流市場(chǎng)已形成萬億規(guī)模,公路運(yùn)輸長(zhǎng)期占據(jù)國(guó)內(nèi)整體貨運(yùn)量的 75% 左右。
       然而,這一巨大市場(chǎng)面臨著嚴(yán)峻的結(jié)構(gòu)性人力供給短缺問題,主要表現(xiàn)為勞動(dòng)力流失率高和未來勞動(dòng)力補(bǔ)給不足——如今有超過半數(shù)的卡車司機(jī)計(jì)劃未來不再做司機(jī),而 96% 的卡車司機(jī)不希望自己的下一代成為司機(jī)。
       此外,重卡的運(yùn)營(yíng)成本也很高,從燃油、司機(jī)、保險(xiǎn)、車輛折舊等方面進(jìn)行統(tǒng)計(jì)分析,在美國(guó),人力和油耗占運(yùn)營(yíng)成本的 70%,在中國(guó),這一比例也超過 50%。同時(shí),長(zhǎng)途運(yùn)輸中的駕駛安全問題也備受關(guān)注。
       基于上述現(xiàn)狀,利用自動(dòng)駕駛技術(shù)來填補(bǔ)勞動(dòng)力缺口、優(yōu)化成本、提高重卡行駛過程中的安全性,已成為大勢(shì)所趨。這也使得干線物流成為能夠最早實(shí)現(xiàn)自動(dòng)駕駛商業(yè)落地的場(chǎng)景之一。
經(jīng)過幾年的發(fā)展,產(chǎn)業(yè)界和學(xué)術(shù)界已經(jīng)基本達(dá)成共識(shí):隨著自動(dòng)駕駛技術(shù)的應(yīng)用,重卡運(yùn)營(yíng)成本可以降低26%,事故率可降低 80%。
       基于中美兩地市場(chǎng)的現(xiàn)狀,以及對(duì)自動(dòng)駕駛技術(shù)光明前景的判斷,智加科技從成立起便以落地應(yīng)用為主導(dǎo),以構(gòu)建生態(tài)為核心,定位為全球最大的兩個(gè)物流市場(chǎng)進(jìn)行賦能。目前,智加在中美兩地均設(shè)有辦公室和研發(fā)中心,超過 25% 的員工有博士學(xué)位,超過 80% 的工程師畢業(yè)于中美兩地排名前五的工科院校;擁有自動(dòng)駕駛核心技術(shù)的全棧研發(fā)能力,包括感知、地圖、定位、決策、規(guī)劃、控制等。資本方面,智加也得到了紅杉資本、金沙江資本、滿幫集團(tuán)等多方的支持。
       智加在過去的幾年里取得了不錯(cuò)的成績(jī):

   •  2017 年 3 月,智加獲得了加州交管局頒發(fā)的自動(dòng)駕駛路測(cè)牌照,成為第一家獲得路測(cè)牌照的中國(guó)初創(chuàng)公司;

   •  隨后,智加在硅谷的真實(shí)車流中完成了近2000公里的實(shí)際路測(cè);

   •  2018 年,智加和與中國(guó)市場(chǎng)份額最大車貨匹配平臺(tái)滿幫集團(tuán)達(dá)成了獨(dú)家戰(zhàn)略合作,并聯(lián)合滿幫、一汽解放和英偉達(dá)成立了四方同盟;

   •  2018 年 11 月,智加獲得了公安部、交通部、工信部和江蘇省政府聯(lián)合發(fā)布的中國(guó)首張營(yíng)運(yùn)自動(dòng)駕駛測(cè)試牌照;

   •  2019 年 1 月,在哥倫布智慧物流大會(huì)上,智加與一汽解放完成了首批智能重卡的交接儀式。
近期也有一些進(jìn)展:
       去年底,智加取得了全國(guó)首張跨區(qū)域的測(cè)試牌照,可在江蘇、安徽、浙江、上海、三省一市的相關(guān)道路上進(jìn)行測(cè)試和數(shù)據(jù)收集;
       去年,智加聯(lián)合一汽解放成立了蘇州摯途科技有限公司,攜手推進(jìn)智能重卡的落地量產(chǎn);
在美國(guó),智加也在持續(xù)進(jìn)行商業(yè)試運(yùn)營(yíng)。去年圣誕前夕,智加的重卡自動(dòng)駕駛了三天三夜,橫跨美國(guó)東西海岸完成了生鮮運(yùn)輸工作,行駛里程達(dá) 2800 英里。
       二、自動(dòng)駕駛落地應(yīng)用的5個(gè)階段
       智加對(duì)自動(dòng)駕駛技術(shù)落地的 5 個(gè)階段有自己的見解:

   •  在干線物流的場(chǎng)景下,第一個(gè)階段叫作“原型期”。在這一階段要做好三件事:確定 L4 級(jí)重卡自動(dòng)駕駛的價(jià)值,制定大致的技術(shù)發(fā)展方向,同時(shí)尋找可靠的伙伴共同來推進(jìn)。

   •  第二個(gè)階段叫作“工程驗(yàn)證期”。在這一階段,最主要的工作是通過驗(yàn)證,證明自動(dòng)駕駛的安全性和經(jīng)濟(jì)性。而且驗(yàn)證不僅僅是路測(cè)驗(yàn)證,還包括建立仿真系統(tǒng)來進(jìn)行驗(yàn)證。

   •  第三個(gè)階段叫作“設(shè)計(jì)驗(yàn)證期”,此前工程驗(yàn)證期驗(yàn)證通過的自動(dòng)駕駛系統(tǒng),需要與量產(chǎn)車進(jìn)行融合設(shè)計(jì),從而設(shè)計(jì)出一款真正的自動(dòng)駕駛的重卡。

   •  第四個(gè)階段叫作“生產(chǎn)驗(yàn)證期”,要進(jìn)行流水線和生產(chǎn)方面的準(zhǔn)備,包括把供應(yīng)鏈打通、把工廠建設(shè)好,這是重卡主機(jī)廠擅長(zhǎng)的事情。

   •  第五個(gè)階段就是“量產(chǎn)”,到了這個(gè)階段,自動(dòng)駕駛重卡已經(jīng)開始大規(guī)模商業(yè)化落地,類似于滿幫這樣的角色將會(huì)在這個(gè)階段發(fā)揮最大效果,推動(dòng)自動(dòng)駕駛重卡進(jìn)行規(guī)模的商業(yè)化試運(yùn)營(yíng)。
       基于以上的五個(gè)階段,智加也分別做了相應(yīng)的規(guī)劃和準(zhǔn)備,包括一些技術(shù)上的創(chuàng)新。
       三、干線物流自動(dòng)駕駛的關(guān)鍵技術(shù)和挑戰(zhàn)
       一輛時(shí)速為 120 公里每小時(shí)、帶掛的重卡,它的制動(dòng)距離通常在 180 米。如果有更大的重量,將會(huì)有 0.6 秒到 0.8 秒的制動(dòng)延時(shí),這會(huì)導(dǎo)致更長(zhǎng)的制動(dòng)距離。
       此外,重卡在濕滑的路面上行駛的制動(dòng)距離將進(jìn)一步增加。為了安全起見,在濕滑路面下的重卡制動(dòng)距離通常需要至少 300 米。另一方面,由于車身高帶掛的特性,重卡司機(jī)的感知盲區(qū)遠(yuǎn)比乘用車大,因此也引發(fā)了大量的事故。
由此引出的自動(dòng)駕駛乘用車和重卡在技術(shù)上的差異,包括感知、標(biāo)定、地圖、定位等內(nèi)容,我接下來會(huì)為大家做拆解。

   •  標(biāo)定
       首先是標(biāo)定。多傳感器同步和內(nèi)外參數(shù)標(biāo)定是所有智能駕駛系統(tǒng)必須解決的問題,其誤差會(huì)通過感知層逐步遞增到規(guī)劃和控制,影響最終的自主行駛。
       傳感器的標(biāo)定可以分為離線的靜態(tài)標(biāo)定和在線的動(dòng)態(tài)標(biāo)定。
       針對(duì)靜態(tài)標(biāo)定,通常采用基于標(biāo)記物的標(biāo)定方法。這種標(biāo)定方法需要選取和設(shè)計(jì)利于不同傳感器能夠同時(shí)進(jìn)行準(zhǔn)確觀測(cè)的特殊標(biāo)記物。為了上述目標(biāo),選取標(biāo)記物時(shí)要考慮其幾何結(jié)構(gòu)和表面材質(zhì),比如相機(jī)對(duì)紋理和角點(diǎn)的觀測(cè)精度、激光對(duì)深度(尤其是深度不連續(xù)位置)的觀測(cè)精度、以及雷達(dá)對(duì)金屬的強(qiáng)反射性等。
       標(biāo)定的整體流程分為兩大類,一類是以 3D 的點(diǎn)集配準(zhǔn)為主要方法,基于 3D 坐標(biāo)之間的對(duì)應(yīng)關(guān)系來實(shí)現(xiàn)標(biāo)定。 另一類是典型的 2D 和 3D 的對(duì)應(yīng)點(diǎn)之間的標(biāo)定問題,可以使用 PNP 的方式來求解。
       重卡面臨的另一個(gè)問題是在線標(biāo)定。由于車身懸掛的抖動(dòng)明顯,可能會(huì)導(dǎo)致兩個(gè)標(biāo)定問題——第一個(gè)是不同傳感器之間的相對(duì)位置會(huì)發(fā)生變化,比如相機(jī)和相機(jī)的相對(duì)位置、相機(jī)和激光的相對(duì)位置發(fā)生偏移。第二是傳感器相對(duì)于大地的坐標(biāo)系會(huì)發(fā)生變化。
       針對(duì)第一個(gè)問題,可以利用左右雙目的高區(qū)分度的特征點(diǎn)來進(jìn)行在線校正。針對(duì)第二個(gè)問題,可以直接使用激光中深度不連續(xù)位置和圖像中逆距離變換求取的邊緣來實(shí)現(xiàn)對(duì)傳感器外參數(shù)漂移的在線標(biāo)定。
       不過,值得注意的是,所有好的在線標(biāo)定系統(tǒng)都對(duì)初值有著嚴(yán)格要求,所以首先還是要實(shí)現(xiàn)重復(fù)性高的離線標(biāo)定,來提供相對(duì)準(zhǔn)確的初值。

   •  感知
       感知方面。智加基于多個(gè)攝像頭、激光雷達(dá)、毫米波雷達(dá)實(shí)現(xiàn)了車周無盲區(qū),以及遠(yuǎn)距離的感知。在前向距離上,智加可以實(shí)現(xiàn)超過500米的靜態(tài)和動(dòng)態(tài)障礙物的檢測(cè)和跟蹤。這種傳感方案與單純地強(qiáng)調(diào)遠(yuǎn)距離感知不同,還兼顧了感知的視野范圍,可以感知到路面的起伏情況。這是實(shí)現(xiàn)重卡安全運(yùn)營(yíng)的一大重要手段。
       另外,在技術(shù)方案中,智加充分利用了多基線配置的雙目視覺和來自于激光毫米波雷達(dá)的數(shù)據(jù)的深度融合。


 圖片22.jpg


       如今,隨著算法的迭代和優(yōu)化,智加車頂傳感器的數(shù)目不斷減少,但始終保留了雙目的配置。這是因?yàn)殡p目在傳感器的自檢、動(dòng)態(tài)標(biāo)定和深度估計(jì)上都給了感知模塊和整體系統(tǒng)很多冗余,比如雙目深度比單目準(zhǔn),點(diǎn)云密度比激光高,同時(shí)左右兩側(cè)相機(jī)可互為冗余,以防其中一個(gè)出現(xiàn)故障。同時(shí),雙目本身也利于在線標(biāo)定。
       而且,由于雙目點(diǎn)云的天然特性,它的幾何結(jié)構(gòu)的信息穩(wěn)定性高于紋理信息,使得它和激光雷達(dá)的數(shù)據(jù)融合可以在深度層面上展開。

   •  車道線檢測(cè)和障礙物感知
       車道線檢測(cè)的方法層出不窮,但實(shí)際上,大多數(shù)時(shí)候,對(duì)車道線的檢測(cè)和改進(jìn)都是基于二維空間,關(guān)于高度的信息估計(jì)幾乎是缺失的。在一些特殊的場(chǎng)景下,車道線的準(zhǔn)確性會(huì)大打折扣。以高速公路收費(fèi)處的匝道為例,其路面并不是一個(gè)典型的平面,而是高度逐漸升高/降低的曲面。
       智加用基于立體視覺估計(jì)的曲面來實(shí)現(xiàn)路面點(diǎn)云的稠密化,從而實(shí)現(xiàn)圖像像素和激光的點(diǎn)和點(diǎn)對(duì)齊;且這種方式使得感知結(jié)果可以和車體坐標(biāo)系建立清晰的物理對(duì)應(yīng)關(guān)系。
有了準(zhǔn)確的路面估計(jì)以后,則需要考慮障礙物的感知問題,尤其是針對(duì)重卡的遠(yuǎn)距離障礙物感知。有了來自于雙目的顏色和深度信息以后,多傳感融合則有更多的操作空間,實(shí)現(xiàn)對(duì)障礙物的類別、位置、朝向的檢測(cè)和跟蹤。

   •  建圖和定位
       智加的建圖和定位依然是多傳感融合的方式。智加高精地圖創(chuàng)建包含了 3D 點(diǎn)云和 2D 圖像作為地圖數(shù)據(jù)的輸入,然后通過離線完成幾何度量信息的生成和優(yōu)化,并在最終使用前進(jìn)行人工的確認(rèn);尤其是要對(duì)不同時(shí)間和不同車輛采集后生成的地圖之間的建圖精度、一致性和重復(fù)性進(jìn)行可視化顯示,最終地圖的采集會(huì)隨著車輛的測(cè)試運(yùn)營(yíng)不斷進(jìn)行增量式的更新。
       特別在高速公路這種具有結(jié)構(gòu)化特點(diǎn)的場(chǎng)景下,創(chuàng)建地圖會(huì)有一些便利,比如可以預(yù)先采集、建立一套典型的適合高速公路環(huán)境的幾何模板,并基于此來完成檢測(cè)重建。
       不過建圖中有一個(gè)容易被大家忽略的問題。未來商用地圖采集車大部分都會(huì)是乘用車,然而它的傳感器配置類型和安裝位置都與重卡有很大不同,比如激光數(shù)據(jù)的測(cè)距精度、返回強(qiáng)度等都有可能出現(xiàn)較大差異?,F(xiàn)在行業(yè)內(nèi)許多公司在測(cè)試時(shí)或 demo 使用的采集車是同一款車,甚至是同一輛車。這就導(dǎo)致地圖精度和傳感器類型、安裝位置、甚至多傳感的標(biāo)定誤差嚴(yán)重耦合。
       智加較早意識(shí)到這點(diǎn),所以目前用來進(jìn)行地圖數(shù)據(jù)采集的是乘用車,用來定位驗(yàn)證的是重卡;同時(shí),智加內(nèi)部也會(huì)實(shí)行類似的交叉驗(yàn)證,完善建圖方法,以及定位算法。

   •  系統(tǒng)冗余設(shè)計(jì)/系統(tǒng)架構(gòu)設(shè)計(jì)
       最終的 L4 級(jí)系統(tǒng)是不需要安全員的,所以需要從系統(tǒng)設(shè)計(jì)方面考慮可靠和冗余。智加對(duì)系統(tǒng)的可靠冗余設(shè)計(jì)包含五個(gè)維度,分別是可靠硬件平臺(tái)、傳感器的冗余、功能算法的冗余、系統(tǒng)架構(gòu)的設(shè)計(jì)以及測(cè)試驗(yàn)證。
可靠的硬件平臺(tái),主要是指車輛平臺(tái),尤其是執(zhí)行機(jī)構(gòu)以及計(jì)算平臺(tái)的可靠性。對(duì)車輛平臺(tái)來說,它的可靠性體現(xiàn)在轉(zhuǎn)向、制動(dòng)、動(dòng)力的冗余。
       計(jì)算平臺(tái)則要滿足功能安全。 L4 級(jí)對(duì)于算力的要求會(huì)比 L2 系統(tǒng)或者 ADAS 系統(tǒng)有顯著的提升,計(jì)算架構(gòu)也逐步從分布式向中央集成式過渡。但這種中央集成式的 ADU 的大功耗也存在著安全隱患,所以智加采用的混合結(jié)構(gòu),部分計(jì)算任務(wù)在傳感器端做,部分計(jì)算任務(wù)在中央 ADU 端做,平衡了算力和功耗。而且,這樣的架構(gòu)也方便之后的冗余系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。
       傳感器的可靠性主要是體現(xiàn)滿足車規(guī),以攝像頭為例,性能上滿足算法對(duì)圖像質(zhì)量的要求。除了傳感器本身的連接穩(wěn)定性,傳感器的靈敏度動(dòng)態(tài)范圍也要有顯著提升。
       傳感器的冗余,即在傳感器故障時(shí)有硬件備份,更重要的是,同一類型的傳感器可以用來做相互校驗(yàn),檢測(cè)系統(tǒng)里的軟失效,如立體視覺。相應(yīng)的還有功能算法冗余,即通過功能算法的冗余來判斷傳感器是否失效。
       重點(diǎn)是智加現(xiàn)在正在采用的 simplex 的架構(gòu)設(shè)計(jì),其中包括抽象的傳感器、抽象的執(zhí)行單元,還有一個(gè) safe landing 系統(tǒng)。這是一套包含了硬件傳感、軟件算法、失效質(zhì)檢、硬件(問題硬件)自隔離的系統(tǒng)。
       最后,還需要一系列高效的測(cè)試驗(yàn)證把整套研發(fā)環(huán)節(jié)跑通,在一些常規(guī)測(cè)試的基礎(chǔ)上加大難度,對(duì)系統(tǒng)的性能邊界進(jìn)行驗(yàn)證。同時(shí),還要有一套高效運(yùn)作的測(cè)試或研發(fā)數(shù)據(jù)管理體系,來對(duì)信息進(jìn)行篩選、整理、分類,從而反哺模型的提升和系統(tǒng)的迭代。
       建立數(shù)據(jù)管理系統(tǒng),要解決三個(gè)問題:第一、怎么收集數(shù)據(jù)?第二、怎么篩選數(shù)據(jù)?第三、怎么使用數(shù)據(jù)?
       圍繞這三個(gè)問題,智加已經(jīng)打通和完善了一整套的數(shù)據(jù)管理系統(tǒng)。這個(gè)系統(tǒng)可以用來跟蹤所有路測(cè)車輛的狀況,包括自動(dòng)駕駛比例、車輛所在位置、油耗里程等等信息,然后通過人工或者自動(dòng)化的方式來標(biāo)注和篩選出有價(jià)值的場(chǎng)景數(shù)據(jù)。
       這些數(shù)據(jù)一部分會(huì)進(jìn)入智加的內(nèi)部平臺(tái),依據(jù)場(chǎng)景分類信息來進(jìn)行自適應(yīng)的采樣,形成二級(jí)或者三級(jí)的標(biāo)注數(shù)據(jù),用于模型的訓(xùn)練、測(cè)試和評(píng)測(cè)。另一部分則用于生成仿真測(cè)試場(chǎng)景。
       經(jīng)過感知團(tuán)隊(duì)和標(biāo)注團(tuán)隊(duì)的努力,智加已經(jīng)圍繞困難場(chǎng)景的車道線標(biāo)定收斂出來一套標(biāo)準(zhǔn)。以車道線檢測(cè)為例,這套標(biāo)準(zhǔn)大體上包含兩個(gè)方向:
       第一,關(guān)心數(shù)據(jù)的分布,要建立一個(gè)完備的場(chǎng)景,以及定的多層次分類體系。也就是說,不僅要評(píng)估模型在比如天氣、光照、道路、場(chǎng)景、交通流等某個(gè)一級(jí)分類維度的性能,還要分析它對(duì)應(yīng)的某個(gè)二級(jí)分類維度的性能,同時(shí)還要建立不同分類、不同維度之間的關(guān)聯(lián)關(guān)系。
       第二,要獨(dú)立客觀地去評(píng)測(cè)模塊和跟蹤模塊,即檢測(cè)和跟蹤要分開。目前,常見的車道線模塊的評(píng)測(cè)采用兩種方式,只評(píng)測(cè)車道線模塊;或者把車道線模塊評(píng)測(cè)和跟蹤同時(shí)進(jìn)行,做最終結(jié)果的評(píng)測(cè)。上面兩種方式操作起來確實(shí)簡(jiǎn)單,但基于這些方式的評(píng)測(cè)結(jié)果十分寬泛,并沒有對(duì)檢測(cè)模塊和跟蹤模塊的性能邊界有一個(gè)明晰的判斷。類比現(xiàn)在傳感器性能突飛猛進(jìn),但我們要清醒地知道,感知模塊性能的提升,到底是得益于傳感器廠商的進(jìn)步,還是得益于自己處理數(shù)據(jù)能力的增強(qiáng)。所以,一定要做類似的獨(dú)立客觀冷靜的測(cè)試。
       具體方法為:首先給跟蹤模塊輸入完美的感知數(shù)據(jù)/感知真值,然后不斷增加噪聲,降低感知輸入的質(zhì)量,模擬車道線的缺失、遮擋、丟幀、處理延時(shí)等,評(píng)測(cè)和確定跟蹤模塊的性能邊界,以及對(duì)感知模塊數(shù)據(jù)輸入的要求。
有了一套分類體系和一套可以獨(dú)立拆分模塊的評(píng)價(jià)體系以后,就能夠解決數(shù)據(jù)使用的問題。如何讓系統(tǒng)在測(cè)試過程中自動(dòng)化去識(shí)別一些不明物體,支撐采集數(shù)據(jù)和篩選數(shù)據(jù)兩個(gè)環(huán)節(jié),這個(gè)問題接下來會(huì)展開講。
       四、L2+ 與 L4 的數(shù)據(jù)閉環(huán)問題
       前文提到了自動(dòng)駕駛技術(shù)量產(chǎn)的五個(gè)階段,在整個(gè)自動(dòng)駕駛的演進(jìn)中,從更高維度理解可以把一個(gè) L2+ 系統(tǒng)等同于一個(gè) L4 系統(tǒng)的設(shè)計(jì)驗(yàn)證階段。然后,把 L2+ 系統(tǒng)里的量產(chǎn)、落地,以及在大量運(yùn)營(yíng)中積累的數(shù)據(jù),轉(zhuǎn)換為 L4 的系統(tǒng)的生產(chǎn)力。
       然而,我們?cè)谟懻撨@個(gè)話題的時(shí)候,要考慮好兩個(gè)核心問題:

   •  數(shù)據(jù)的價(jià)值。比如特斯拉 Autopilot 是 L2+ 系統(tǒng),Waymo Robotaxi 是 L4 級(jí)系統(tǒng),但兩者之間的數(shù)據(jù)閉環(huán)并沒有太多價(jià)值,因?yàn)閮烧叩臄?shù)據(jù)特性不一樣,配置也不一樣。

   •  收集數(shù)據(jù)的效率和成本。海量用戶數(shù)據(jù)打通之后,安排標(biāo)注員在后臺(tái)翻看數(shù)據(jù)幾乎不現(xiàn)實(shí),效率也十分低下,這種情況根本無法支撐數(shù)據(jù)閉環(huán)。
       針對(duì)第一個(gè)問題,有觀點(diǎn)認(rèn)為,特斯拉明確表示不需要激光,僅靠視覺就能實(shí)現(xiàn)無人駕駛。但同樣在視覺領(lǐng)域頗有建樹的 Mobileye 在其官網(wǎng)上對(duì) EyeQ 系列芯片的發(fā)展介紹中寫道,“EyeQ 4 支持 L3 級(jí)自動(dòng)駕駛,EyeQ 5 支持 L4 級(jí)以上自動(dòng)駕駛”。
       然而,這并不代表靠視覺起家的 Mobileye 認(rèn)為僅靠視覺就能實(shí)現(xiàn)高級(jí)別自動(dòng)駕駛。其官網(wǎng)上同樣用加粗的黑體字介紹道,“It has the capacity to process data from more than eight camera sensors,in addition to radars and LiDARs…more than sixteen multi-mega-pixel cameras and other sensors”。
       至于上述“other sensors”是什么,目前未有明確的說法,但我大膽推測(cè),這里面應(yīng)該包含激光雷達(dá)。因而在絕大多數(shù)的、非特斯拉的自動(dòng)駕駛公司的心里面,要實(shí)現(xiàn) L4 就需要激光雷達(dá)來提供準(zhǔn)確的深度信息。
       L4 系統(tǒng)對(duì)場(chǎng)景理解的準(zhǔn)確性提出了新的要求,因此對(duì)傳感器數(shù)據(jù)的需求將從模態(tài)分裂走向模態(tài)融合。我們不再把數(shù)據(jù)按照激光、視覺、毫米波雷達(dá)來區(qū)分,而是按照紋理、色彩、深度甚至速度來理解。
       因此我們要回答數(shù)據(jù)閉環(huán)的價(jià)值問題,本質(zhì)上是要判斷 L2+ 系統(tǒng)的傳感器類型以及使用方式與 L4 級(jí)階段的差異有多大?差異越小,它的數(shù)據(jù)閉環(huán)就越有價(jià)值。
       乘用車作為生活資料,它在 L2+ 階段無法省掉駕駛員,它的利潤(rùn)也只能通過載客服務(wù)來實(shí)現(xiàn)。因此,單車成本上,預(yù)留給傳感器和計(jì)算平臺(tái)的成本有限,可能無法負(fù)擔(dān)起激光雷達(dá)的成本。同時(shí)它的算力也受限制,通常只能進(jìn)行后融合。因此 L2+ 階段的傳感器針對(duì)乘用車來說,它的傳感類型和使用方式與 L4 級(jí)階段有著比較顯著的差異。
       商用車雖然在 L2+ 階段也無法省掉駕駛員,但是它作為生產(chǎn)資料,本身就在持續(xù)創(chuàng)造營(yíng)收。同時(shí),還可以通過節(jié)油和提升車輛保值來進(jìn)一步增大利潤(rùn)空間,從而使得單車成本上可以預(yù)留更多給傳感器和計(jì)算平臺(tái)。
       這種情況下的 L2+ 級(jí)階段傳感器的類型和使用方式與 L4 階段的差異較小。這也是為什么我們認(rèn)為干線物流在這方面會(huì)優(yōu)先落地的原因。
       基于此,我也分享一下智加目前的相關(guān)工作。我們?nèi)诤狭肆Ⅲw視覺和低成本激光雷達(dá),通過后處理來實(shí)現(xiàn)場(chǎng)景的三維重建,從而獲得成本低、精度高且稠密的 RGBD 數(shù)據(jù)。未來我們可以從這種稠密的深度信息里抽樣,泛化成在 L4 級(jí)階段使用的激光雷達(dá)的點(diǎn)云數(shù)據(jù)。
       數(shù)據(jù)的價(jià)值判斷問題處理好了,再來看看收集或篩選這些有價(jià)值數(shù)據(jù)所要付出的成本,以及它的效率。
       在大規(guī)模運(yùn)營(yíng)后的產(chǎn)生的海量數(shù)據(jù),只有通過在線且自動(dòng)化的方式才能保證數(shù)據(jù)收集和篩選的效率高、成本低。智加的數(shù)據(jù)來源目前主要有 4 個(gè),包括在線人工標(biāo)注、離線人工標(biāo)注、離線自動(dòng)標(biāo)注和在線自動(dòng)標(biāo)注。
       目前我們已經(jīng)從前面的三個(gè)階段逐步過渡到了第四個(gè)階段,即在線自動(dòng)化標(biāo)注,意味著我們數(shù)據(jù)收集的成本會(huì)越來越低,效率會(huì)越來越高。
       在線自動(dòng)化的典型代表是大家津津樂道的影子模式,通過來比較人工駕駛的軌跡和系統(tǒng)規(guī)劃的軌跡之間的偏差,比如說當(dāng)路徑上的橫向位置、縱向速度和加速度偏差超過系統(tǒng)設(shè)定閾值時(shí),就自動(dòng)抓取當(dāng)前場(chǎng)景的數(shù)據(jù)并回傳。從這種設(shè)計(jì)上我們可以看出,它采集的數(shù)據(jù)本身是面向決策和規(guī)劃端的,我個(gè)人認(rèn)為這種設(shè)計(jì)有兩個(gè)不足:
       第一,采集的數(shù)據(jù)容易非平衡。影子模式基于人工駕駛的情況下、軌跡端結(jié)果觸發(fā),所以它沒有辦法直接反映出其他模塊的問題,容易導(dǎo)致數(shù)據(jù)的非平衡性。
       第二,數(shù)據(jù)采集成本比較高。由于它的觸發(fā)條件在系統(tǒng)功能層面,粒度較粗,無法反映出上游模塊的問題,只能采用事件觸發(fā)點(diǎn)前后的全量數(shù)據(jù)采樣,在數(shù)據(jù)存儲(chǔ)空間和流量空間有限的情況下,極容易導(dǎo)致冗余數(shù)據(jù),從而導(dǎo)致數(shù)據(jù)使用效率下降,數(shù)據(jù)采集成本攀升。
       智加內(nèi)部有一套 Plum 系統(tǒng),它包含離線自動(dòng)化標(biāo)注和在線自動(dòng)化標(biāo)注兩大部分,我們還針對(duì)感知、定位、決策、規(guī)劃、控制等各個(gè)模塊制定了相關(guān)指標(biāo),用于自動(dòng)化篩選有價(jià)值場(chǎng)景數(shù)據(jù)。
       對(duì)于需要強(qiáng)算力或者需要大存儲(chǔ)空間、或者需要進(jìn)行多幀數(shù)據(jù)關(guān)聯(lián)的指標(biāo),我們采用離線計(jì)算。對(duì)于經(jīng)過輕巧設(shè)計(jì)、對(duì)算力和存儲(chǔ)要求低的指標(biāo),我們則采用在線自動(dòng)化的方式,幫助我們更高效、更低成本的抓取數(shù)據(jù)。
       今天的技術(shù)內(nèi)容講了很多,除此之外也談到了現(xiàn)狀、產(chǎn)業(yè)和數(shù)據(jù)閉環(huán)等內(nèi)容。
       自動(dòng)駕駛還是一個(gè)新興學(xué)科,它的標(biāo)準(zhǔn)和規(guī)范尚未健全,因此,我們大家都是這一領(lǐng)域的參與者、設(shè)計(jì)者和建設(shè)者,期待未來更多交流和碰撞。
                                                                                                                                                      (來源:雷鋒網(wǎng))