當(dāng)前位置：

一文讀懂無(wú)人駕駛 - 感知模塊

無(wú)人駕駛領(lǐng)域涉及多學(xué)科知識(shí)，是交叉融合學(xué)科。首先，車輛根據(jù)功能不同可以劃分為定位、環(huán)境感知、路徑規(guī)劃和決策控制四個(gè)基本模塊。也有研究者將定位放在感知模塊當(dāng)中，也就是無(wú)人駕駛的三個(gè)模塊，感知、規(guī)劃、控制。

2024-02-26 09:35:01

感知是指無(wú)人駕駛系統(tǒng)從環(huán)境中收集信息并從中提取相關(guān)知識(shí)的能力。其中，環(huán)境感知特指對(duì)于環(huán)境的場(chǎng)景理解能力，例如障礙物的位置，道路標(biāo)志、標(biāo)記的檢測(cè)，行人車輛的檢測(cè)等數(shù)據(jù)的語(yǔ)義分類。而定位是指相對(duì)于環(huán)境的位置，車輛需要根據(jù)傳感器得到的數(shù)據(jù)直到自己此時(shí)此刻位于地圖的哪個(gè)位置，因此認(rèn)為定位也是感知的一部分。

規(guī)劃是無(wú)人車為了某一目標(biāo)而做出一些有目的性的決策的過(guò)程，對(duì)于無(wú)人駕駛車輛而言，這個(gè)目標(biāo)通常是指從出發(fā)地到達(dá)目的地，同時(shí)避免障礙物，并且不斷優(yōu)化駕駛軌跡和行為以保證乘客的安全舒適。規(guī)劃層通常又被細(xì)分為任務(wù)規(guī)劃，行為規(guī)劃和動(dòng)作規(guī)劃三層。

控制則是控制理論的內(nèi)容，包括如何控制無(wú)人車，給出精準(zhǔn)的命令和指令使得車輛準(zhǔn)確地按照規(guī)劃好的路線行進(jìn)的能力。

本文重點(diǎn)闡述感知，感知就像是人類的感官，了解世界、認(rèn)知世界，而車輛感知環(huán)境需要不同類別的傳感器，通過(guò)這些傳感器的信息，獲得障礙物的位置、速度以及可能的行為，獲得可行駛區(qū)域，交通規(guī)則等，感知領(lǐng)域采用的傳感器有激光雷達(dá)、單目攝像頭、雙目攝像頭、深度相機(jī)、毫米波雷達(dá)等等。下面簡(jiǎn)要介紹幾類傳感器和其特性。

首先介紹激光雷達(dá)，激光雷達(dá)是一類使用激光進(jìn)行探測(cè)和測(cè)距的設(shè)備，它能夠每秒鐘向環(huán)境發(fā)送數(shù)百萬(wàn)光脈沖，它的內(nèi)部是一種旋轉(zhuǎn)的結(jié)構(gòu)，這使得激光雷達(dá)能夠?qū)崟r(shí)的建立起周圍環(huán)境的3維地圖。通常來(lái)說(shuō)，激光雷達(dá)以10Hz左右的速度對(duì)周圍環(huán)境進(jìn)行旋轉(zhuǎn)掃描，其掃描一次的結(jié)果為密集的點(diǎn)構(gòu)成的3維圖，每個(gè)點(diǎn)具備（x,y,z）信息，這個(gè)圖被稱為點(diǎn)云圖（Point Cloud Graph）。激光雷達(dá)因其可靠性目前仍是無(wú)人駕駛系統(tǒng)中最重要的傳感器，然而，在現(xiàn)實(shí)使用中，激光雷達(dá)并不是完美的，往往存在點(diǎn)云過(guò)于稀疏，甚至丟失部分點(diǎn)的問(wèn)題，對(duì)于不規(guī)則的物體表面，使用激光雷達(dá)很難辨別其模式，在諸如大雨天氣這類情況下，激光雷達(dá)也無(wú)法使用。為了理解點(diǎn)云信息，通常來(lái)說(shuō)，我們對(duì)點(diǎn)云數(shù)據(jù)進(jìn)行兩步操作：分割和分類。其中，分割是為了將點(diǎn)云圖中離散的點(diǎn)聚類成若干個(gè)整體，而分類則是區(qū)分出這些整體屬于哪一個(gè)類別（比如說(shuō)行人，車輛以及障礙物）。點(diǎn)云的分割聚類有眾多方法，不在這里一一展開(kāi)，但是點(diǎn)云的處理以及合理的算法都會(huì)對(duì)最終的結(jié)果產(chǎn)生很大的影響。

單目攝像頭獲得的是二位圖像信息，缺失了三維世界中的深度信息，保留了顏色信息，是密集矩陣，在圖像上用像素點(diǎn)描繪物體，基本類型是采用RGB三通道表達(dá)并且呈現(xiàn)出顏色。

雙目攝像頭需要有兩個(gè)攝像機(jī)之間的變換矩陣，這樣的結(jié)構(gòu)更加類似于人類的雙眼，通過(guò)兩個(gè)視角可以恢復(fù)物體在三維世界當(dāng)中的深度信息，但是每個(gè)時(shí)刻兩個(gè)相機(jī)的計(jì)算量是很大的。

深度相機(jī)能夠?qū)崟r(shí)地測(cè)量每個(gè)像素點(diǎn)的距離。但是,由于這種發(fā)射--接受的測(cè)量方式,使得它使用范圍比較受限。用紅外進(jìn)行深度值測(cè)量的 RGB-D 相機(jī),容易受到日光或其他傳感器發(fā)射的紅外光干擾,因此不能在室外使用,同時(shí)使用多個(gè)時(shí)也會(huì)相互干擾。對(duì)于透射材質(zhì)的物體,因?yàn)榻邮懿坏椒瓷涔?所以無(wú)法測(cè)量這些點(diǎn)的位置。此外,深度相機(jī)在成本、功耗方面,都有一些劣勢(shì)。

毫米波雷達(dá)分為遠(yuǎn)距離雷達(dá)（LRR）和近距離雷達(dá)（SRR），由于毫米波在大氣中衰減弱，所以可以探測(cè)感知到更遠(yuǎn)的距離，其中遠(yuǎn)距離雷達(dá)可以實(shí)現(xiàn)超過(guò)200m的感知與探測(cè)。毫米波雷達(dá)的多項(xiàng)優(yōu)勢(shì)，使其目前在汽車防撞傳感器中占比較大。與激光雷達(dá)返回的數(shù)據(jù)坐標(biāo)不同，其返回的是物體點(diǎn)的距離角度信息。

下表展示了幾種傳感器的差別和不同環(huán)境下感知效果的優(yōu)劣。表中提及的Ultrosonic是超聲波測(cè)距儀，常見(jiàn)于私家車輛的倒車系統(tǒng)，HD-map是人們常說(shuō)的高清地圖，在無(wú)人駕駛領(lǐng)域也是重要的組成部分，此處加入分析并不公平，因?yàn)镠D-map不是傳感器，它無(wú)法進(jìn)行動(dòng)態(tài)物體的感知，甚至靜態(tài)目標(biāo)的更新也是HD-map無(wú)法判斷的，在這里它只是環(huán)境的一種綜合表現(xiàn)形式，它的獲取需要相機(jī)、雷達(dá)等其他傳感器。

不同傳感器之間的原理和優(yōu)缺點(diǎn)分析

傳感器	原理	優(yōu)點(diǎn)	缺點(diǎn)
Lidar	主動(dòng)式，ToF	測(cè)距準(zhǔn)	稀疏，感知范圍近
Camera	被動(dòng)式	稠密感知，范圍遠(yuǎn)	測(cè)距不準(zhǔn)
Radar	主動(dòng)式，多普勒頻移測(cè)速	測(cè)距，測(cè)速準(zhǔn)	噪點(diǎn)多，非金屬障礙物召回低，無(wú)法進(jìn)行識(shí)別
Ultrosonic	主動(dòng)式	近距離測(cè)距	位置感知粗糙，只有近距離判別能力
HD-map	提前感知靜態(tài)元素	可以無(wú)差錯(cuò)精細(xì)感知，減輕線上感知負(fù)擔(dān)	增加了HD-map和和定位的依賴
RGB-D	接受器同時(shí)接收可見(jiàn)光和激光	原始就是4D數(shù)據(jù)	感知范圍近

從表中可知，無(wú)人駕駛感知中的傳感器，不是舍此即彼的關(guān)系，而是需要多種傳感器共同感知環(huán)境，獲得更加可靠的數(shù)據(jù)，因此多傳感器融合在無(wú)人駕駛當(dāng)中必不可少，在多傳感器融合下進(jìn)行無(wú)人駕駛感知，可以有效結(jié)合各個(gè)傳感器的優(yōu)勢(shì)，或得更加可靠的數(shù)據(jù)，得到更加廣泛的使用環(huán)境。視覺(jué)配合毫米波雷達(dá)，視覺(jué)配合激光雷達(dá)、深度相機(jī)配合毫米波雷達(dá)、激光雷達(dá)配合毫米波雷達(dá)等等，都成為研究人員嘗試的方案。同時(shí)經(jīng)過(guò)研究人員的驗(yàn)證，結(jié)合好的融合算法，多傳感器的融合結(jié)果往往都強(qiáng)于某一類傳感器的單探測(cè)結(jié)果。因此，無(wú)人駕駛感知中的多傳感器融合方法是值得探尋和研究的。

在這些傳感器中，相機(jī)和激光是研究者熱衷的兩種傳感器，兩者輸出數(shù)據(jù)也大相徑庭，在眾多研究者的文章中，有關(guān)它們的算法最多，涉及這兩者的融合算法也是研究熱點(diǎn)，在實(shí)際應(yīng)用車輛中也常見(jiàn)這兩種傳感器，甚至涉及它們的融合算法。因此本文會(huì)選擇激光雷達(dá)和攝像機(jī)這兩種傳感器作為實(shí)驗(yàn)傳感器，同時(shí)選擇目標(biāo)級(jí)融合。

在傳感器融合理論中，根據(jù)融合中心的位置劃分?jǐn)?shù)據(jù)集融合、特征級(jí)融合（即目標(biāo)級(jí)）以及決策級(jí)融合，數(shù)據(jù)級(jí)融合會(huì)把傳感器采集的原始數(shù)據(jù)直接送入融合中心進(jìn)行計(jì)算，這樣的結(jié)果損失是最小的，但是計(jì)算量是最大的，RoadStar公司曾提出將兩種傳感器數(shù)據(jù)直接作為輸入送進(jìn)神經(jīng)網(wǎng)絡(luò)框架的方法，但是目前找到的相關(guān)成果有限。特征級(jí)融合是傳感器得到結(jié)果在決策時(shí)考慮融合，這種誤差最大，但是計(jì)算量最小。無(wú)人駕駛中普遍采用特征級(jí)融合，即每個(gè)處理單元預(yù)處理檢測(cè)目標(biāo)，融合中心給出目標(biāo)結(jié)果。