編者語(yǔ):本公眾號(hào)已部署智駕AI助手,后臺(tái)回復(fù)消息即可免費(fèi)使用!
近年來(lái),自動(dòng)駕駛技術(shù)不斷演進(jìn),從最初的輔助駕駛到如今的高階智駕,技術(shù)路線(xiàn)和系統(tǒng)架構(gòu)也不斷發(fā)生著變化。在自動(dòng)駕駛系統(tǒng)中,決策規(guī)劃模塊承擔(dān)著“思考”的作用,作為自動(dòng)駕駛汽車(chē)的“大腦”,它直接影響汽車(chē)在真實(shí)道路環(huán)境中的安全性和魯棒性。
在自動(dòng)駕駛系統(tǒng)開(kāi)發(fā)初期,很多車(chē)企都選擇依托基于規(guī)則的決策方案,通過(guò)提前定義好的行駛規(guī)則、邏輯判斷和專(zhuān)家經(jīng)驗(yàn),對(duì)各種交通場(chǎng)景進(jìn)行應(yīng)急響應(yīng)和規(guī)劃。這種方法因其明確可解釋、經(jīng)過(guò)大量工程驗(yàn)證而獲得了廣泛應(yīng)用。這一方法看似非常合理,但在面對(duì)邊緣場(chǎng)景時(shí),其處理表現(xiàn)往往不盡如人意。
隨著深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)和大數(shù)據(jù)技術(shù)的迅速發(fā)展,端到端大模型方案開(kāi)始在自動(dòng)駕駛領(lǐng)域嶄露頭角。這類(lèi)方案通過(guò)大規(guī)模數(shù)據(jù)訓(xùn)練,從傳感器輸入直接映射到車(chē)輛控制命令,在理論上能夠捕捉到傳統(tǒng)規(guī)則難以覆蓋的復(fù)雜情況。在端到端發(fā)展的同時(shí),我們不禁會(huì)思考:在擁有端到端大模型方案的同時(shí),是否還需要繼續(xù)發(fā)展基于規(guī)則的方案?
端到端有何優(yōu)劣?
從技術(shù)實(shí)現(xiàn)角度來(lái)看,端到端大模型方案的優(yōu)勢(shì)在于其數(shù)據(jù)驅(qū)動(dòng)的本質(zhì)。利用深度神經(jīng)網(wǎng)絡(luò),不論是卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)還是近年來(lái)備受關(guān)注的Transformer架構(gòu),都可以從原始傳感器數(shù)據(jù)中自動(dòng)提取特征,并構(gòu)建復(fù)雜的決策映射。模型訓(xùn)練過(guò)程中,不僅能夠利用大量的實(shí)際道路數(shù)據(jù),還可以通過(guò)仿真和增強(qiáng)學(xué)習(xí)補(bǔ)充少見(jiàn)場(chǎng)景,從而使得模型具備更好的泛化能力。大模型通過(guò)端到端學(xué)習(xí),理論上能將感知、規(guī)劃、控制等多個(gè)環(huán)節(jié)緊密結(jié)合,減少了中間轉(zhuǎn)換過(guò)程中引入的誤差積累,這對(duì)于解決高速行駛時(shí)的瞬間決策具有很大優(yōu)勢(shì)。尤其在面對(duì)那些難以提前枚舉的復(fù)雜交通場(chǎng)景時(shí),數(shù)據(jù)驅(qū)動(dòng)的方法有望發(fā)現(xiàn)隱含的規(guī)律,提供更為靈活和細(xì)致的響應(yīng)。
端到端方案的“黑盒”特性一直是業(yè)內(nèi)討論的焦點(diǎn)。由于深度神經(jīng)網(wǎng)絡(luò)的內(nèi)部結(jié)構(gòu)極其復(fù)雜,其決策過(guò)程往往缺乏足夠的可解釋性,這無(wú)疑會(huì)引發(fā)一系列驗(yàn)證和監(jiān)管問(wèn)題。特別是在極端情況下或面對(duì)罕見(jiàn)場(chǎng)景時(shí),模型輸出往往難以用直觀(guān)的邏輯進(jìn)行解釋。為了解決這一問(wèn)題,研究人員嘗試引入注意力機(jī)制、后驗(yàn)分析和混合驗(yàn)證技術(shù),力圖揭示神經(jīng)網(wǎng)絡(luò)內(nèi)部部分激活對(duì)應(yīng)的決策依據(jù)。但無(wú)論如何,這種解釋仍然無(wú)法達(dá)到傳統(tǒng)基于規(guī)則系統(tǒng)那種“邏輯明確、易于審計(jì)”的水平。
端到端模型的訓(xùn)練還依賴(lài)于大量數(shù)據(jù),而數(shù)據(jù)本身的采集、標(biāo)注和質(zhì)量控制也存在巨大挑戰(zhàn)。實(shí)際道路數(shù)據(jù)中,常見(jiàn)場(chǎng)景占據(jù)了絕大多數(shù),但一些極端事件和異常情況的數(shù)據(jù)十分稀缺,這使得模型在應(yīng)對(duì)這些少見(jiàn)情況時(shí)可能表現(xiàn)欠佳。數(shù)據(jù)不平衡和標(biāo)簽噪聲問(wèn)題直接關(guān)系到模型的魯棒性與可靠性,這也是自動(dòng)駕駛系統(tǒng)必須嚴(yán)格考慮的問(wèn)題。
基于規(guī)則的決策有何優(yōu)劣?
基于規(guī)則的決策系統(tǒng)在自動(dòng)駕駛的早期研發(fā)中被廣泛應(yīng)用,其最大的優(yōu)點(diǎn)在于可解釋性和安全性。通過(guò)提前設(shè)計(jì)好每種交通情境下應(yīng)采取的措施,確保在已知場(chǎng)景中始終執(zhí)行預(yù)設(shè)的安全策略。通過(guò)給決策系統(tǒng)提供駕駛員實(shí)踐中積累的豐富的交通規(guī)則、行駛邏輯和安全冗余設(shè)計(jì),使決策系統(tǒng)在面對(duì)多數(shù)常規(guī)情況時(shí)可以有穩(wěn)定的表現(xiàn)。當(dāng)遇到突發(fā)情況或傳感器數(shù)據(jù)異常時(shí),基于規(guī)則的系統(tǒng)也可以作為“最后一道防線(xiàn)”,提供較為明確的安全響應(yīng),但在遇到特殊的邊緣場(chǎng)景時(shí),其靈活性仍有不足,但其確定性和驗(yàn)證容易性卻遠(yuǎn)超端到端模型。
是否要絕對(duì)站隊(duì)?
端到端和基于規(guī)則,是否一定要站隊(duì)?其實(shí)現(xiàn)階段,端到端的方案并未成熟,依舊有很多的技術(shù)難題需要解決,現(xiàn)在越來(lái)越多的研究和開(kāi)發(fā)團(tuán)隊(duì)正探索如何將兩種方案進(jìn)行有機(jī)融合。端到端大模型方案在高層次上進(jìn)行環(huán)境理解和初步?jīng)Q策,同時(shí)在低層次的控制和關(guān)鍵安全環(huán)節(jié)中嵌入基于規(guī)則的約束。這樣的分層設(shè)計(jì)既能夠發(fā)揮數(shù)據(jù)驅(qū)動(dòng)方法對(duì)復(fù)雜場(chǎng)景的適應(yīng)優(yōu)勢(shì),也能在面對(duì)未知情況時(shí)依靠預(yù)設(shè)規(guī)則確保系統(tǒng)的安全性。如在低速行駛、狹窄路段、復(fù)雜交叉口等關(guān)鍵場(chǎng)景下,可額外啟用規(guī)則模塊來(lái)監(jiān)控和調(diào)整端到端模型的輸出,確保決策結(jié)果不會(huì)超出預(yù)期范圍。
這種混合方案看似非常完美,但還需要考慮如何在不同模型之間實(shí)現(xiàn)融合、如何設(shè)計(jì)安全回退機(jī)制,以及如何在實(shí)時(shí)性和計(jì)算資源之間取得平衡。目前有技術(shù)提出通過(guò)軟硬件協(xié)同的方式來(lái)實(shí)現(xiàn)這一目標(biāo),如利用專(zhuān)用AI加速芯片和邊緣計(jì)算設(shè)備,實(shí)現(xiàn)大模型的高效推理,同時(shí)在關(guān)鍵安全模塊中采用低延遲的規(guī)則邏輯,二者協(xié)同工作,確保在毫秒級(jí)響應(yīng)下也能完成復(fù)雜決策計(jì)算。
筆者觀(guān)點(diǎn)
智駕最前沿以為,自動(dòng)駕駛技術(shù)始終是一項(xiàng)跨學(xué)科、跨領(lǐng)域的系統(tǒng)工程,其發(fā)展必然會(huì)經(jīng)歷多個(gè)技術(shù)方案不斷碰撞、融合和優(yōu)化的過(guò)程。在這一過(guò)程中,單一依靠數(shù)據(jù)驅(qū)動(dòng)或規(guī)則設(shè)計(jì)都難以滿(mǎn)足所有安全和性能要求。端到端大模型雖然在處理大規(guī)模、復(fù)雜數(shù)據(jù)方面具有明顯優(yōu)勢(shì),但其“黑盒”特性和安全驗(yàn)證問(wèn)題使得其在關(guān)鍵安全環(huán)節(jié)難以獨(dú)自擔(dān)當(dāng)重任。基于規(guī)則的方案在緊急狀態(tài)下能夠迅速觸發(fā)預(yù)設(shè)策略,避免潛在風(fēng)險(xiǎn),其明確的邏輯和低延遲的計(jì)算為系統(tǒng)提供了不可替代的安全保障。未來(lái)的自動(dòng)駕駛決策系統(tǒng)必然會(huì)采用一種混合架構(gòu),通過(guò)不同技術(shù)層次和模塊的協(xié)同運(yùn)作,實(shí)現(xiàn)系統(tǒng)整體性能的最優(yōu)化,通過(guò)技術(shù)的多樣性,彌補(bǔ)各自的短板,讓自動(dòng)駕駛汽車(chē)在面對(duì)不確定和復(fù)雜場(chǎng)景時(shí),可以提供一種全方位的安全保障。
自動(dòng)駕駛決策系統(tǒng)的設(shè)計(jì)不應(yīng)被單一技術(shù)方案所限制。數(shù)據(jù)驅(qū)動(dòng)的大模型和傳統(tǒng)的基于規(guī)則方法各自具備獨(dú)特優(yōu)勢(shì),只有兩者的深度融合,才能在保證系統(tǒng)高效、實(shí)時(shí)響應(yīng)的同時(shí),提供足夠的安全冗余和可解釋性。正是這種互補(bǔ)性,讓自動(dòng)駕駛技術(shù)可以在復(fù)雜、多變的交通環(huán)境中展現(xiàn)出強(qiáng)大的適應(yīng)能力。自動(dòng)駕駛決策系統(tǒng)的挑戰(zhàn)不在于選哪個(gè)的問(wèn)題,而是在于如何將不同技術(shù)有機(jī)整合,構(gòu)建出一個(gè)既前瞻又穩(wěn)健的自動(dòng)駕駛決策系統(tǒng)。只有如此,自動(dòng)駕駛技術(shù)才能真正走出實(shí)驗(yàn)室,進(jìn)入現(xiàn)實(shí)世界,為人們提供更加智能、安全的出行體驗(yàn)。
-- END --