理想汽車智能駕駛研發(fā)副總裁郎咸朋

新能源汽車的下半場,智能化果然是主旋律。價格戰(zhàn)之外,各家智駕能力的比拼,也成為搶占用戶心智的新戰(zhàn)場。

作為造車新勢力的代表之一,理想在7月份月銷過5萬輛,去年?duì)I收超千億,銷量上已經(jīng)實(shí)現(xiàn)了“遙遙領(lǐng)先”,但在智駕上的動作一直并不激進(jìn),或者可以有有些保守。

那么,作為智駕上的“差生”或者說“后進(jìn)生”,理想接下來的智駕策略是什么?為什么大家都在切入端到端?現(xiàn)在爆火的端到端智駕新故事,理想又會如何來講?端到端之后,智駕還能拼什么?

近日,鈦媒體App與理想智能駕駛研發(fā)副總裁郎咸朋有了一次深入的溝通,對于理想的智駕以及端到端,也有了全面的了解。

快速迭代不是“Follow別人

眾所周知,理想在造車新勢力里面,智駕并不是其標(biāo)簽。隨著銷量穩(wěn)定上來,智能化開始成為新能源汽車主要競爭高地,理想也開始加碼在智駕領(lǐng)域的布局和投入。

有人說,理想拿出端到端+VLM大模型的智駕技術(shù),意在追趕特斯拉、華為的智駕能力。

對此,郎咸朋表示,“我們看問題就看本質(zhì),表面上看起來我們不停地在迭代,或者說跟別人學(xué),或者自己探索,但實(shí)際上我們不是一個專門follow別人的公司,我們有自己對這個技術(shù)和對產(chǎn)品的本質(zhì)理解。”

那么,問題來了,端到端到底是什么?其實(shí)就是End-to-End Deep Learning(端到端深度學(xué)習(xí)),簡言之,就是要建立一個完整的學(xué)習(xí)系統(tǒng),直接從原始數(shù)據(jù)中不斷學(xué)習(xí),并生成所需的輸出,不需要人為將任務(wù)分解成多個中間步驟。

在簡單一點(diǎn)來理解,就是采用端到端的這套智駕方案,通過不斷給它喂養(yǎng)數(shù)據(jù),它會自己思考學(xué)習(xí)成長,不斷長大變強(qiáng)。這也是為什么大家現(xiàn)在都在追逐端到端智駕到根本原因。

據(jù)郎咸朋介紹,去年一年,理想做了三次技術(shù)的研發(fā)迭代,最先用的都是NPN神經(jīng)地圖先驗(yàn)(‌Neural Map Prior)這種帶有場景的方案,然后又轉(zhuǎn)換到無圖的方案,最后才迭代到現(xiàn)在的端到端方案。

如此頻繁地迭代技術(shù)路線,不斷地推倒重來,是否會造成智駕能力的落后?

郎咸朋認(rèn)為,從本質(zhì)上看,無論是NPN(神經(jīng)先驗(yàn)網(wǎng)絡(luò))還是重圖的方案,它最大的問題是只要你用圖你就做不了全國,想要解決它,那就只能做無圖,所以就切到無圖了。但不管是分段式,還是模塊化的無圖方案,它都有上限在哪,都還有人的規(guī)則在里面,無法做到非常擬人的駕駛體驗(yàn)。

“理想并不是為了做端到端而去做端到端,而是把無圖、有圖這些技術(shù)方案全部都做完一遍,領(lǐng)悟到這些技術(shù)特點(diǎn)之后,才堅(jiān)定地選擇下一步要走端到端這套方案。”郎咸朋說道。

翻譯一下就是,理想其實(shí)也一直在思考如何實(shí)現(xiàn)自動駕駛,如何讓當(dāng)下的高階輔助駕駛有更好的體驗(yàn),在技術(shù)上經(jīng)過不斷地探索之后,發(fā)現(xiàn)原來的方式是無法真正做到自動駕駛,這也是為什么后面在端到端上有了系統(tǒng)1+系統(tǒng)2的思考。

在郎咸朋看來,端到端最大的改變不是一個模型還是兩個模型的問題,而是從端到端開始,才真正地用人工智能的方式去做自動駕駛。之前的串聯(lián)式的端到端、分小模塊的這種做自動駕駛的方式,其實(shí)本質(zhì)上它還是一個產(chǎn)品,更偏傳統(tǒng)一點(diǎn)的產(chǎn)品研發(fā)思路。

怎么來理解呢?就是原來做自動駕駛的思路,是先定義需求,然后根據(jù)需求來拆解成很多場景,場景再拆分為很多的研發(fā)模塊,最后用人制定的規(guī)則去實(shí)現(xiàn),這里面可能用到小模型。研發(fā)出來之后,再根據(jù)場景去做測試評價,有問題再改,沒問題就交付。

在這個過程中,會有哪些問題呢?

如果場景有限,比如高速NOA場景,這種道路結(jié)構(gòu)比較簡單,但擴(kuò)展到城市之后,它的場景就出現(xiàn)了爆炸式的變化,跟高速場景完全不一樣。如果繼續(xù)用以前的方式去設(shè)計(jì)場景、去設(shè)計(jì)規(guī)則、去實(shí)現(xiàn)驗(yàn)證,這里面的每一步就會遇到很大挑戰(zhàn)。

因?yàn)閳鼍笆菬o窮無盡的,一旦還用原來的方式去做自動駕駛,那自動駕駛的能力邊界就顯而易見了,只能按照你的設(shè)計(jì)達(dá)到某種能力,而超出能力之外的東西,它無法做到。

簡單來說,按照原來用規(guī)則來做智能駕駛的開發(fā)思路,必須要在一個確定性的環(huán)境下來研發(fā)。即使問題比較復(fù)雜,也想把它拆解得非常確定,然后再去研發(fā)做測試。而自動駕駛是沒法用規(guī)則式來做的。

郎咸朋對此的理解是未來自動駕駛,我們面臨的是一個不確定的變化的復(fù)雜的世界,如果還用一些確定性的模式去做這個事情,那就肯定是有問題的。

“所以從端到端開始,它的變化并不是說一個模型、兩個模型這么簡單,而是它整個的思維,就是研發(fā)的流程和方式發(fā)生了巨大的改變,這里面沒有任何的規(guī)則,我能做的是喂給他高質(zhì)量的數(shù)據(jù),再加上訓(xùn)練提升模型的能力,讓它能做出更好的規(guī)劃和決策。”郎咸朋總結(jié)道。

智駕團(tuán)隊(duì)規(guī)模不會超兩千人

端到端的流行,或者說人工智能的快速發(fā)展,讓智駕領(lǐng)域的研發(fā)人才也開始出現(xiàn)了變化。

端到端這套方案,讓整個研發(fā)流程變得相對簡單了,主要就是挑選數(shù)據(jù)、訓(xùn)練模型、評估模型、世界模型。

理想的這套智駕方案是“端到端+VLM+世界模型”,其中最大的特點(diǎn)是采用了雙系統(tǒng)的理論,快系統(tǒng)做出及時的處理響應(yīng),慢系統(tǒng)對應(yīng)復(fù)雜的思考邏輯判斷,雙系統(tǒng)共同地組成了人類認(rèn)知和思維的機(jī)制。

具體來看,理想的這套智駕方案,其系統(tǒng)一就是快系統(tǒng),應(yīng)用端到端模型來實(shí)現(xiàn),主要是挑選數(shù)據(jù)、訓(xùn)練數(shù)據(jù);系統(tǒng)二則是慢系統(tǒng),采用VLM的視覺語言大模型來實(shí)現(xiàn),主要是其能像人一樣的思考能力,更好理解復(fù)雜道路情況,應(yīng)對未知場景。經(jīng)過預(yù)研和研發(fā),目前理想的這兩套系統(tǒng)都已實(shí)現(xiàn)量產(chǎn)上車。

世界模型,在理想內(nèi)部稱其為系統(tǒng)三,它是一個考試系統(tǒng),系統(tǒng)一+系統(tǒng)二的能力由系統(tǒng)三去評價和認(rèn)證。

原來自動駕駛系統(tǒng)的評價與測試,都是由人來執(zhí)行完成的,不管是跑大的路測還是跑場地的測試都是由人去評價的,但人是評價不過來的。而系統(tǒng)三則能夠取代人去考核系統(tǒng)一和系統(tǒng)二的能力,通過考核之后,就迭代上線,然后進(jìn)入下一輪的考核。

流程變簡單了,相對應(yīng)需要的人也變少了。郎咸朋坦言,除了研發(fā)這些系統(tǒng)平臺的過程需要人,其實(shí)并沒有很多人參與到實(shí)際的一些東西上來,會大大減少人的使用,確實(shí)用不了那么多人。

“我們可能會比特斯拉現(xiàn)在的人多一些,但是也不會達(dá)到一兩千人的規(guī)模。”郎咸朋說道。

實(shí)際上,理想智能駕駛研發(fā)部門的人員數(shù)量,相對蔚來、小鵬、華為等是最少的,據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),截至今年5月,華為、小鵬、蔚來智駕團(tuán)隊(duì)人數(shù)分別超過7000人、3000人和1300人。而根據(jù)媒體的一些報(bào)道,截至6月初,理想智駕部門員工總?cè)藬?shù)已被削減到了800人以內(nèi)。

不過,自動駕駛最重要的是什么?是人才與資金嗎?郎咸朋的回答是,長期來看,算力和數(shù)據(jù)都很重要,但前期對人才這塊,算法更重要。

在他看來,沒有數(shù)據(jù),將來算法的訓(xùn)練、驗(yàn)證,都是沒有基礎(chǔ)的。但在模型迭代的基礎(chǔ)上,最重要的方式是怎么去找到更優(yōu)質(zhì)的數(shù)據(jù),這個數(shù)據(jù)除了量要足夠大,質(zhì)量也要足夠好。 

端到端之后,智駕還能拼什么?

當(dāng)大家都開始做端到端,站在了同一起跑線上,那么,智駕還能拼什么?

在郎咸朋看來,真正到了人工智能時代,大家其實(shí)就拼兩件事,一是你有沒有足夠多的高質(zhì)量的數(shù)據(jù);二是你有沒有與之相匹配的充足的訓(xùn)練算力的集群。

總而言之,自動駕駛到最后拼的就是算力和數(shù)據(jù),但這兩件事,門檻都非常高。如果企業(yè)的資金儲備不足以支撐每年訓(xùn)練的花費(fèi),那就不可能玩到后邊的L3或L4;如果車企的這個車的保有量不夠多,數(shù)據(jù)其實(shí)也無法支撐它的訓(xùn)練需求。

據(jù)郎咸朋透露,目前理想自動駕駛每年投在訓(xùn)練花費(fèi)上是10億人民幣,預(yù)估將來花費(fèi)要到每年10億美金。

郎咸朋指出,“這只是訓(xùn)練的算力,還不包括其他的人員各種費(fèi)用。如果未來你一年拿不出10億美金來做訓(xùn)練,可能將來會在自動駕駛的競爭當(dāng)中淘汰。

理想L系列產(chǎn)品都是套娃,但套娃對于自動駕駛來說,郎咸朋認(rèn)為是有極大的好處,所有的攝像頭規(guī)格和安裝的位置都是一致的,數(shù)據(jù)都可以復(fù)用。

但有的廠商,它的產(chǎn)品可能有轎車、SUV等,傳感器可能也都不太一樣,對于這些廠商來說,數(shù)據(jù)的復(fù)用確實(shí)會是一個問題。

而關(guān)于智駕,郎咸鵬認(rèn)為,一方面要有遠(yuǎn)期的考慮和探索,另一方面也要有現(xiàn)在的交付和產(chǎn)品迭代。對于公司來說,智駕是一個產(chǎn)品。公司做任何一個產(chǎn)品,目的還是為了盈利,為了去獲得更好的現(xiàn)金流,更好的利潤,從而讓企業(yè)有更好的發(fā)展。

如何證明自己的智駕能力是行業(yè)第一梯隊(duì)?在郎咸朋看來,“用戶實(shí)打?qū)嵉靥湾X買你,我覺得這是最有說服力的。最終還是要看搭載AD max車型的銷量,這將決定理想的智駕能力是不是在市場上領(lǐng)先,這是最硬核的指標(biāo)。

其實(shí),理想AD PRO、AD max兩款產(chǎn)品,價格僅相差3萬元,主要差別就在智能駕駛的硬件和功能上,其他都一樣。

簡言之,對于郎咸朋來說,如果在理想的總銷量中,搭載高階智駕版本的AD max車型占比較高,那就說明理想的智駕做得還是成功的。

這樣來看,后面車企在智駕上的卷,還是會回歸到卷銷量上。只有越來越多的用戶選擇智駕版,才能證明你的智駕功能是做得真的好用。如果用戶都不選智駕版,即便真的做得很好,又如何來證明呢?

畢竟,智駕能力到底強(qiáng)不強(qiáng),不是誰的嗓門大誰就強(qiáng),還是需要拉出來遛遛才知道。(本文首發(fā)于鈦媒體App,作者|張敏)

本文系作者 敏行 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請綁定手機(jī)號后發(fā)表評論

登錄后輸入評論內(nèi)容

掃描下載App