編者語(yǔ):后臺(tái)回復(fù)“入群”,加入「智駕最前沿」微信交流群
現(xiàn)在無(wú)圖/輕地圖的智駕方案比較火,主要就是因?yàn)橐揽扛呔貓D來(lái)為感知兜底的方式成本太高,那么為什么現(xiàn)在大家都齊刷刷地轉(zhuǎn)向bev/occ+transformer的方案呢?這種方案相比于用SLAM方法實(shí)時(shí)建立一定時(shí)間范圍內(nèi)的局部語(yǔ)義地圖,再在此地圖上做規(guī)劃的方案優(yōu)勢(shì)在哪兒?以SLAM為基礎(chǔ)做局部導(dǎo)航的缺陷在哪兒?
作為SLAM算法方向的研究生來(lái)發(fā)表一下自己的看法。
首先我認(rèn)為題主是混淆了一些概念,SLAM主要是解決定位問題,而BEV/Occ+Transforme主要解決感知任務(wù)(局部語(yǔ)義地圖),感知是以定位為前提的,只不過這個(gè)定位可以不是SLAM定位。
一般SLAM算法的使用方法分為兩步,先建圖,后定位。在機(jī)器人應(yīng)用中,這里第一步建好的地圖 主要有兩個(gè)作用,一個(gè)作用是用來(lái)進(jìn)行全局的路徑規(guī)劃,另外一個(gè)作用是進(jìn)行第二步的定位。
在自動(dòng)駕駛場(chǎng)景中道路環(huán)境經(jīng)常變化,高精地圖的維護(hù)成本較高,因此自駕采用了重感知輕地圖的方案,其中輕地圖并不是無(wú)地圖,自駕中全局的路徑規(guī)劃問題可以依靠百度地圖等來(lái)進(jìn)行,定位問題可以使用輪速計(jì)、IMU、衛(wèi)星導(dǎo)航組合的方式來(lái)替代。然后在這種定位方法的基礎(chǔ)上進(jìn)行局部語(yǔ)義地圖的創(chuàng)建。
而題主說(shuō)的為啥不采用SLAM的方式進(jìn)行局部語(yǔ)義地圖的創(chuàng)建,我的理解是自駕中還是使用了SLAM中幀間位姿估計(jì)的方法,只不過沒有采用基于先驗(yàn)地圖的SLAM定位方法而已,所以這種多傳感器組合定位的方法只是沒有被叫做SLAM定位而已。
此外,雖然自駕中大多采用輕地圖重感知的方案,但是室內(nèi)機(jī)器人像是掃地機(jī)器人、人形機(jī)器人、倉(cāng)運(yùn)機(jī)器人等等還是采用的SLAM+局部語(yǔ)義地圖的方法,因?yàn)槭覂?nèi)機(jī)器人要求更高的精度,而且GPS等傳感器在室內(nèi)也無(wú)法使用,所以目前來(lái)說(shuō)SLAM+感知的方案對(duì)于室內(nèi)機(jī)器人來(lái)說(shuō)還是主流。
最后,其實(shí)我感覺容易讓題主產(chǎn)生疑惑的點(diǎn)更多的在于名稱的叫法上面,只不過搞深度學(xué)習(xí)的人把定位+局部語(yǔ)義地圖這一塊工作叫做感知任務(wù)而已,其實(shí)跟SLAM+局部語(yǔ)義地圖的叫法區(qū)別不大,局部語(yǔ)義地圖的創(chuàng)建方法可以是一樣的,區(qū)別只在于定位上面而已。
這個(gè)問題很好,借此澄清幾個(gè)概念:
1 無(wú)“圖”智駕,也需要有圖,無(wú)“圖”其實(shí)是偷換概念,因?yàn)樯虡I(yè)和監(jiān)管的原因。
2 不管無(wú)圖有圖,自動(dòng)駕駛感知都有出帶語(yǔ)義的OD,這個(gè)感知和BEV與否沒關(guān)系,和Transformer與否也沒關(guān)系。所以題目里,“無(wú)圖方案都用xxx”并沒有邏輯,其實(shí)是 無(wú)圖方案也可以不用xxx,有圖方案也可以用xxx。
3 無(wú)圖方案,都會(huì)使用SLAM技術(shù)建圖。SLAM技術(shù)是一個(gè)建圖和定位的技術(shù)的打包集合。不管有圖無(wú)圖,都會(huì)使用SLAM技術(shù)做融合定位或者叫定位配準(zhǔn)。所以,這個(gè)提問,連續(xù)犯了三個(gè)邏輯錯(cuò)誤。
4 倒數(shù)第二問,又來(lái)到了 規(guī)劃 問題,規(guī)劃和SLAM也并沒有什么相關(guān)性。所以我也沒看懂這個(gè)問題:“為什么用感知xxx,做定位xxx,比規(guī)劃xxx好在哪兒”。自動(dòng)駕駛都有先驗(yàn)地圖的,不會(huì)像掃地機(jī)器人先探索一遍才知道怎么走的,除非先撞一圈墻。
5 關(guān)于最后一問,大家都會(huì)“以SLAM為基礎(chǔ)做局部導(dǎo)航”,這句話等同于“以定位技術(shù)為基礎(chǔ)做定位”。
首先第一“無(wú)圖”并不是沒有高精地圖,是不要外部提供的高精地圖,內(nèi)部是需要自建圖;
第二:SLAM建圖可以作為無(wú)圖智駕一種方式,叫記憶行車,業(yè)內(nèi)也有就是大疆,小鵬的通勤模式,這種模式是可以只用導(dǎo)航地圖,但是SLAM一次并不能得到全部道路元素與結(jié)構(gòu),需要跑重復(fù)的道路幾次,所以智駕系統(tǒng)會(huì)表現(xiàn)出一回生二回熟,一次比一次開的好,但這也就意味著它需要你跑同樣的路線,SLAM建圖是能適用于你經(jīng)常上下班或者同一路線的通勤模式;
第三:bev/occ + transformer 不是一個(gè)方案,SLAM也是可以使用bev生成的道路拓?fù)渥越ǖ貓D的,另外有SLAM也并不意味著不需要occ,occ對(duì)于沒有激光雷達(dá)方案,道路異形障礙物檢測(cè)是必須的;
第四個(gè):一定時(shí)間范圍內(nèi)的局部語(yǔ)義地圖,如果簡(jiǎn)單依賴視覺bev+occ,是沒有超視距信息的,也能用,但是你要接受它可能變道到匯入車道以及在遮擋時(shí)出現(xiàn)一些意想不到的問題,這種模式上限也就是有圖;
首先就是高速場(chǎng)景,基于高精地圖建立的先驗(yàn)地圖信息更新比較慢,圖商的地圖車造價(jià)很高,都是季度更新的,最多是按照月去更新,所以如果在他們建圖歪了一些的話,進(jìn)行SLAM匹配時(shí)結(jié)果就會(huì)歪,因此這個(gè)技術(shù)路線就不是很成功的。
BEV可以實(shí)時(shí)感知周圍前后20m甚至更遠(yuǎn)的距離,足夠規(guī)劃去使用。
-- END --
聲明:內(nèi)容源自3D視覺之心,文中觀點(diǎn)僅供分享交流,不代表本公眾號(hào)立場(chǎng),如涉及版權(quán)等問題,請(qǐng)您告知,將及時(shí)處理!