不過,純視覺方案的局限性也十分突出。攝像頭屬于被動(dòng)傳感器,性能高度依賴環(huán)境光照,在逆光、眩光、黑夜、大雨、大霧等復(fù)雜場景下,感知能力會(huì)大幅衰減,遠(yuǎn)不及激光雷達(dá)的穩(wěn)定性。

以激光雷達(dá)為核心的多傳感器融合陣營則認(rèn)為,在可見的未來,機(jī)器智能難以復(fù)刻人類基于經(jīng)驗(yàn)的常識(shí)與直覺,惡劣環(huán)境下必須依靠激光雷達(dá)等硬件冗余,來彌補(bǔ)軟件算法的不足。

簡言之,純視覺路線將技術(shù)壓力全部集中于算法,賭的是AI智能化的突破。多傳感器融合則更側(cè)重工程落地的安全性,選擇的是經(jīng)過驗(yàn)證的穩(wěn)妥方案。

目前,Waymo、小鵬、蔚來等主流車企與自動(dòng)駕駛公司,均站在多傳感器融合陣營,在他們看來,安全是自動(dòng)駕駛不可逾越的紅線,而硬件冗余是保障安全的核心途徑。

值得一提的是,兩條路線并非完全割裂,正呈現(xiàn)相互融合的趨勢(shì):純視覺方案開始引入更多類型的傳感器補(bǔ)充感知能力;多傳感器融合方案中,視覺算法的地位也持續(xù)提升,成為理解場景語義的關(guān)鍵核心。

激光雷達(dá)與毫米波雷達(dá)的互補(bǔ)博弈

即便在多傳感器融合陣營內(nèi)部,也存在一場關(guān)于傳感器選型的細(xì)分爭議:毫米波雷達(dá)成本僅數(shù)百元,而早期激光雷達(dá)動(dòng)輒數(shù)萬美元,為何車企仍愿為激光雷達(dá)投入高額成本?

激光雷達(dá)(LiDAR)可通過發(fā)射激光束并測(cè)算返回時(shí)間,構(gòu)建出超高精度的3D點(diǎn)云圖像,能精準(zhǔn)解決其他傳感器難以應(yīng)對(duì)的極端場景(Corner Case)。其角分辨率極高,可清晰識(shí)別行人姿態(tài)、車輛輪廓,甚至路面微小障礙物。

在L4/L5級(jí)商業(yè)自動(dòng)駕駛領(lǐng)域,激光雷達(dá)是唯一能同時(shí)滿足高精度感知與靜態(tài)物體檢測(cè)的傳感器,為了實(shí)現(xiàn)基礎(chǔ)自動(dòng)駕駛功能與安全冗余,這筆成本堪稱車企必須支付的 “入場券”。

但激光雷達(dá)并非完美無缺。激光本質(zhì)是紅外光,波長極短,當(dāng)雨滴、霧滴、雪花、煙塵等顆粒的尺寸與激光波長接近時(shí),會(huì)引發(fā)激光散射與吸收,產(chǎn)生大量“噪聲”點(diǎn)云,嚴(yán)重影響感知精度。

4D毫米波雷達(dá)則恰好能彌補(bǔ)這一短板,其具備全天候工作能力,在惡劣天氣下可憑借強(qiáng)穿透性,率先探測(cè)前方障礙物并輸出距離、速度數(shù)據(jù)。不過,毫米波雷達(dá)的回波點(diǎn)極為稀疏,僅能形成少量點(diǎn)云,無法像激光雷達(dá)那樣勾勒物體輪廓與形狀,還可能因電子干擾出現(xiàn)“幽靈識(shí)別”的誤判。低分辨率的缺陷,決定了它只能作為輔助傳感器上車,無法成為感知核心。

由此可見,激光雷達(dá)與4D毫米波雷達(dá)并非替代關(guān)系,而是形成了“常規(guī)場景靠毫米波雷達(dá)控成本,復(fù)雜場景靠激光雷達(dá)保安全”的互補(bǔ)邏輯,不同車型會(huì)根據(jù)定位采用差異化配置:L4級(jí)Robotaxi與豪華車型,通常采用“激光雷達(dá)為主、毫米波雷達(dá)為輔”的策略,不計(jì)成本堆砌傳感器以追求極致安全與性能上限;L2+、L3級(jí)量產(chǎn)經(jīng)濟(jì)型車型,則以“攝像頭 + 毫米波雷達(dá)”為基礎(chǔ),僅在車頂?shù)汝P(guān)鍵位置配備1-2顆激光雷達(dá),打造高性價(jià)比的感知方案。

車企圍繞傳感器的選型爭議,本質(zhì)是一場以最低成本實(shí)現(xiàn)最高安全的技術(shù)探索與商業(yè)博弈。未來,各類傳感器的融合將進(jìn)一步深化,催生出更多元化的感知搭配方案。

端到端與模塊化的架構(gòu)對(duì)決

如果說傳感器是自動(dòng)駕駛的“眼睛”,那算法架構(gòu)就是其“大腦”,而“大腦”的構(gòu)建模式,正經(jīng)歷模塊化與端到端的激烈對(duì)決。

長期以來,自動(dòng)駕駛系統(tǒng)普遍采用模塊化設(shè)計(jì),將完整駕駛?cè)蝿?wù)拆解為感知、預(yù)測(cè)、規(guī)劃、控制等獨(dú)立子任務(wù)。每個(gè)模塊各司其職,配備專屬算法與優(yōu)化目標(biāo),如同一條分工明確的流水線。

這種架構(gòu)的優(yōu)勢(shì)十分明顯:可解釋性強(qiáng)、支持并行開發(fā)、便于調(diào)試維護(hù)。但它的缺陷也同樣致命——局部最優(yōu)不等于全局最優(yōu),各模塊在信息傳遞過程中,會(huì)對(duì)原始數(shù)據(jù)進(jìn)行簡化與抽象,導(dǎo)致大量關(guān)鍵信息在層層流轉(zhuǎn)中丟失,最終制約系統(tǒng)的整體性能上限。

2022-2023年,以特斯拉FSD V12為代表的“端到端”模型橫空出世,徹底顛覆了傳統(tǒng)架構(gòu)范式。這一方案的靈感源于人類駕駛學(xué)習(xí)邏輯:新手司機(jī)不會(huì)先鉆研光學(xué)原理與交通規(guī)則,而是通過觀察教練操作直接習(xí)得駕駛技能。

端到端模型摒棄了人為的模塊劃分,通過學(xué)習(xí)海量人類駕駛數(shù)據(jù),構(gòu)建起龐大的神經(jīng)網(wǎng)絡(luò),可直接將傳感器輸入的原始數(shù)據(jù),映射為方向盤轉(zhuǎn)角、油門開度、剎車力度等終端駕駛控制指令。

與模塊化架構(gòu)相比,端到端模型全程無信息損耗,性能上限更高,還能大幅簡化開發(fā)流程;但其“黑箱”特質(zhì)也帶來了嚴(yán)峻挑戰(zhàn),一旦發(fā)生事故,工程師難以追溯問題根源,無法判斷是算法誤判還是數(shù)據(jù)缺陷,后續(xù)優(yōu)化更是無從下手。

端到端模型的出現(xiàn),推動(dòng)自動(dòng)駕駛從“規(guī)則驅(qū)動(dòng)”轉(zhuǎn)向“數(shù)據(jù)驅(qū)動(dòng)”,但“黑箱”風(fēng)險(xiǎn)讓眾多重視安全的車企望而卻步,且海量訓(xùn)練數(shù)據(jù)的需求,也只有具備大規(guī)模車隊(duì)的企業(yè)才能滿足。

為此,行業(yè)衍生出折中方案——“顯式端到端”,即在端到端模型中保留可行駛區(qū)域、目標(biāo)軌跡等中間輸出,力求在性能突破與可解釋性之間找到平衡。

VLA與世界模型的智能定義之爭

隨著AI發(fā)展,新的戰(zhàn)場在大模型內(nèi)部開辟。這關(guān)乎自動(dòng)駕駛的靈魂,它應(yīng)該是輔助駕駛的思考者,還是執(zhí)行者?

世界模型信奉“先建模、再?zèng)Q策”的邏輯,更追求對(duì)駕駛場景的深度認(rèn)知與過程可控,也被稱為認(rèn)知派。

該路線認(rèn)為,自動(dòng)駕駛系統(tǒng)要像人類駕駛員一樣,先在“大腦”中構(gòu)建出周圍環(huán)境的數(shù)字化虛擬模型,再基于這個(gè)模型模擬不同駕駛策略的潛在結(jié)果,最終篩選出最優(yōu)方案。它強(qiáng)調(diào)AI需先理解世界的運(yùn)行規(guī)律,再結(jié)合傳統(tǒng)自動(dòng)駕駛模塊完成決策,將大模型的認(rèn)知能力與成熟的工程控制方案結(jié)合,規(guī)避純算法決策的幻覺風(fēng)險(xiǎn)。

VLA(視覺-語言-動(dòng)作模型)信奉能力“涌現(xiàn)”,追求結(jié)果最優(yōu),被稱為端到端的終極形態(tài)。該流派主張只要模型足夠大、數(shù)據(jù)足夠多,AI就能自己從零開始學(xué)會(huì)駕駛的一切細(xì)節(jié)和規(guī)則,無需預(yù)先構(gòu)建顯性的環(huán)境模型,最終其駕駛能力會(huì)超越人類和基于規(guī)則的系統(tǒng)。它直接將傳感器輸入的視覺信息、環(huán)境語言描述與終端控制動(dòng)作綁定,實(shí)現(xiàn)從感知到執(zhí)行的一站式?jīng)Q策。

圍繞VLA與世界模型的爭議,本質(zhì)是自動(dòng)駕駛智能決策邏輯的路線分歧,也延續(xù)了模塊化與端到端方案的核心辯論。

從可解釋性來看,VLA存在著難以溯源的黑箱困境。如果一輛搭載VLA功能的車輛發(fā)生了一次急剎車,工程師幾乎無法追溯原因:是因?yàn)樗殃幱罢`判為坑洞?還是它學(xué)到了某個(gè)人類司機(jī)的不良習(xí)慣?這種無法調(diào)試、無法驗(yàn)證的特性,與汽車行業(yè)嚴(yán)格的功能安全標(biāo)準(zhǔn)形成了根本性沖突。

世界模型的核心是“先構(gòu)建環(huán)境認(rèn)知模型,再分步推演決策”,其決策鏈路本就分為“感知-建模-規(guī)劃-控制”等明確模塊,每個(gè)環(huán)節(jié)都有獨(dú)立的輸出和可監(jiān)測(cè)的運(yùn)行狀態(tài),因此具備全程可分解、可分析、可優(yōu)化的特質(zhì)。

世界模型與VLA的核心差異之一就是可溯源性,其模塊化的決策鏈路能讓工程師精準(zhǔn)定位問題環(huán)節(jié)。如果遇到復(fù)雜路況,工程師可以清晰看到完整決策過程:傳統(tǒng)感知模塊識(shí)別到未知物體、世界模型將其建模為“被風(fēng)吹動(dòng)的塑料袋”,并模擬其運(yùn)動(dòng)軌跡,規(guī)劃模塊據(jù)此決定“無需緊急剎車,僅輕微減速避讓即可”。即便發(fā)生事故,也能精準(zhǔn)界定是建模環(huán)節(jié)的疏漏,還是規(guī)劃模塊的判斷失誤。

除了可解釋性的兩極分化,訓(xùn)練成本與數(shù)據(jù)需求也是車企猶疑不決的核心原因之一。

VLA需要海量的“視頻-控制信號(hào)”配對(duì)數(shù)據(jù),即輸入一段8攝像頭同步視頻,必須輸出對(duì)應(yīng)的方向盤轉(zhuǎn)角、油門開合度、剎車力度等實(shí)時(shí)控制信號(hào)。這類數(shù)據(jù)不僅采集難度大,且標(biāo)注制作成本極高,僅少數(shù)擁有大規(guī)模車隊(duì)的企業(yè)能夠支撐。

世界模型的優(yōu)勢(shì)則在于數(shù)據(jù)來源的廣泛性,它可先利用互聯(lián)網(wǎng)規(guī)模的“圖像-文本”“環(huán)境-規(guī)則”等多模態(tài)數(shù)據(jù)完成預(yù)訓(xùn)練,構(gòu)建起基礎(chǔ)的世界認(rèn)知框架,再通過真實(shí)駕駛數(shù)據(jù)和仿真場景數(shù)據(jù)進(jìn)行微調(diào),既能降低數(shù)據(jù)采集成本,也能通過仿真推演補(bǔ)足極端場景的數(shù)據(jù)缺口。

回顧自動(dòng)駕駛的派系之爭,不難發(fā)現(xiàn),這些技術(shù)博弈從未以某一方的完全勝利告終,而是在碰撞中不斷融合,走向更高層次的技術(shù)統(tǒng)一:激光雷達(dá)與視覺正整合為多模態(tài)感知系統(tǒng),實(shí)現(xiàn)全場景精準(zhǔn)感知;模塊化架構(gòu)開始吸納端到端的優(yōu)勢(shì),平衡性能與可解釋性;AI大模型則為所有系統(tǒng)注入認(rèn)知智能,推動(dòng)自動(dòng)駕駛向更高階進(jìn)化。

那些曾困擾行業(yè)的技術(shù)謎題,或許沒有絕對(duì)標(biāo)準(zhǔn)答案,但每一次爭議與探索,都成為自動(dòng)駕駛技術(shù)迭代的重要注腳,持續(xù)推動(dòng)著這一賽道向前邁進(jìn)。

本文系作者 極智GeeTech 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

15:27

南向資金凈賣出額達(dá)100億港元

15:25

工商銀行:關(guān)于修訂代理個(gè)人客戶貴金屬競價(jià)交易業(yè)務(wù)協(xié)議并明確強(qiáng)平保證金比例的公告

15:24

南向資金凈賣出額達(dá)90億港元

15:23

伊朗最高領(lǐng)袖發(fā)電文哀悼遇襲身亡的伊情報(bào)部長

15:19

阿特斯旗下光伏科技公司增資至4.8億元

15:18

國債期貨收盤集體下跌,30年期主力合約跌0.42%

15:16

南向資金凈賣出額達(dá)70億港元

15:12

南向資金凈賣出額達(dá)60億港元

15:11

上海出口集裝箱運(yùn)價(jià)指數(shù)下跌3.40點(diǎn),中國出口集裝箱運(yùn)價(jià)指數(shù)上漲4.5%

15:08

南向資金凈賣出額達(dá)50億港元

15:07

A股收評(píng):三大指數(shù)漲跌不一,光伏、逆變器板塊爆發(fā)

15:02

國內(nèi)商品期貨多數(shù)收跌,LU燃油跌超8%

15:00

兩部門:做好2026年高校畢業(yè)生等青年就業(yè)工作

14:58

日本計(jì)劃到2030年引入AI機(jī)器人用于安保、廢棄物處理等場景

14:56

皖鄂電力互濟(jì)工程今天開工,總投資約45.8億元

14:55

韓國政府制定卡塔爾液化天然氣進(jìn)口完全中斷的應(yīng)對(duì)方案

14:54

歐洲央行管委:如果物價(jià)前景惡化,歐洲央行可能需要在4月份加息

14:53

新易盛漲近9%,成交額超300億元

14:52

吉利汽車盤中漲超8%,市值2100億創(chuàng)年內(nèi)新高

14:47

亞太主要股指收盤,韓國綜合指數(shù)漲0.31%

掃描下載App