昨天晚上 8 點(diǎn),小鵬 1024 科技日如期舉行,核心主題有 4 個(gè):
智能駕駛
智能交互
智能機(jī)器人
飛行汽車
我們最為關(guān)注的自然是「智能駕駛」,活動(dòng)現(xiàn)場吳新宙博士直接給出了 XNGP 的推送時(shí)間。
G9 Max 版 XNGP 發(fā)布計(jì)劃:
2022 交付即有高速 NGP、記憶泊車等功能;
2023 上半年城市 NGP 發(fā)布,支持廣州、深圳,新增首發(fā)上海,全國范圍開放紅綠燈識(shí)別并直行通過路口的能力;
2023 下半年大部分無圖城市開放變道、超車、左右轉(zhuǎn)能力;
2024 全場景打通,實(shí)現(xiàn)從車位到車位的智能導(dǎo)航輔助駕駛能力。
P5 E 版 & P7 E 版 XPILOT 發(fā)布計(jì)劃:
2022-2023 上半年開放紅綠燈識(shí)別、車道級(jí)導(dǎo)航功能;
2023 下半年高速 NGP 策略優(yōu)化(限速調(diào)節(jié)、脫手檢測等)。
其中最大的亮點(diǎn)莫過于在 2023 年上半年會(huì)在 G9 Max 版本車型上推送城市 NGP,并且支持上海,這個(gè)時(shí)間點(diǎn),相比同為新勢力的蔚來和理想則至少有超過 1 年以上的領(lǐng)先,以至于我在看完之后,真的有下單 G9 的沖動(dòng)。
明確了接下來的迭代計(jì)劃,我們回到發(fā)布會(huì),看看小鵬拿什么支撐接下來的更新計(jì)劃。
今年的發(fā)布會(huì)上,吳新宙博士提出的第一個(gè)問題就是:為什么要做難百倍以上的城市場景?
恰巧我們今年 9 月在社區(qū)中討論過這個(gè)問題,到底應(yīng)該繼續(xù)打磨高速領(lǐng)航還是盡早上城市領(lǐng)航。
72 人參與,65% 支持繼續(xù)打磨高速領(lǐng)航,35% 支持盡早上城市領(lǐng)航。
活動(dòng)現(xiàn)場吳新宙博士拋了一組數(shù)據(jù):
用戶用車?yán)锍讨谐鞘械缆氛急?71%
用戶用車時(shí)長城市道路占比 90%
途徑城市道路的用戶 100%
這個(gè)是用戶總用車場景的數(shù)據(jù)統(tǒng)計(jì)。
城區(qū)輔助駕駛周滲透率 84%
城市 NGP 里程滲透率 63%
通行效率相比人類駕駛員 90%
平均百公里被動(dòng)接管次數(shù) 0.6 次
這是小鵬 P5 城市 NGP 推送之后產(chǎn)生的數(shù)據(jù),數(shù)據(jù)顯示每 100 km 可使用城市 NGP 的道路,就有 63 km 是城市 NGP 在工作。
顯然,城市場景就是用戶的高頻場景和剛需場景,但是為什么大家都希望繼續(xù)打磨高速領(lǐng)航功能?
從大部分用戶的評(píng)論中可以看出,大家在希望繼續(xù)打磨高速領(lǐng)航功能的核心原因在于預(yù)設(shè)了一個(gè)立場:因?yàn)槌鞘袌鼍斑^于復(fù)雜,現(xiàn)在的技術(shù)下城市領(lǐng)航一定不好用,所以不如去打磨高速領(lǐng)航。
在這種邏輯下,去打磨高速領(lǐng)航似乎是一個(gè)很合理舉動(dòng),但是再回頭看看上面這組數(shù)據(jù),并不是我們不需要,而是我們認(rèn)為做不到。
而無論是特斯拉還是小鵬汽車,他們?cè)跊Q定去攻克城市場景的時(shí)候,目標(biāo)必然是推出一個(gè)「好用的城市領(lǐng)航」功能。
也正是這種從終局思考問題的邏輯,才讓他們能夠正視困難,并且努力克服。
就像一條好走的路,和一條難走但正確的路,特斯拉和小鵬都選擇難走但正確的路。
至于這里的難度,吳新宙博士同樣給了一組相對(duì)量化的數(shù)據(jù):
城市 NGP 的代碼量是高速 NGP 的 6 倍;
城市 NGP 感知模型的數(shù)據(jù)是高速 NGP 的 4 倍;
預(yù)測/規(guī)劃/控制相關(guān)的代碼是高速 NGP 的 88 倍。
這還是在有高精地圖輔助情況的數(shù)據(jù)對(duì)比,而小鵬也明確表示,目標(biāo)在明年下半年做到無圖城市開放道路的變道、超車、左右轉(zhuǎn)能力。
為了克服城市場景的各種刁鉆場景,小鵬從「感知」這個(gè)源頭開始解決問題。
在發(fā)布會(huì)上,吳新宙首次對(duì)外透露,在 G9 上小鵬將采用 XNet 全新一代感知架構(gòu)。
處理方式和特斯拉類似,均會(huì)將周身攝像頭的感知結(jié)果輸入 Transformer 神經(jīng)網(wǎng)絡(luò),進(jìn)行多幀時(shí)序前融合,輸出 BEV 視角下動(dòng)態(tài)目標(biāo)物的 4D 信息和靜態(tài)目標(biāo)物的 3D 信息。
簡單來說就是,原來的技術(shù)框架下,相當(dāng)于讓你通過多個(gè)只有模糊位置關(guān)聯(lián)的視角、通過多張類似于連環(huán)畫的圖片來感知周圍的世界,而且還要判斷周圍車輛的速度預(yù)測他們的行駛軌跡。
這樣的感知結(jié)果下,哪怕是讓一個(gè)老司機(jī)來判斷,也是十分困難的。
而現(xiàn)在的技術(shù)框架下,系統(tǒng)會(huì)直接輸出一個(gè)帶周圍車輛動(dòng)態(tài)信息的上帝視角。
這樣操作帶來的好處是可以大幅提升靜態(tài)目標(biāo)物的 3D 信息監(jiān)測的精度。用吳新宙的話來說就是:「這套感知架構(gòu)有實(shí)時(shí)產(chǎn)生高精地圖的能力。」
更精準(zhǔn)的動(dòng)態(tài)目標(biāo)物的 4D 信息,也意味著系統(tǒng)可以做到更強(qiáng)的變道能力和博弈能力。
當(dāng)然這套強(qiáng)大的大模型神經(jīng)網(wǎng)絡(luò)也不是說有就有的。
活動(dòng)現(xiàn)場吳新宙博士透露,強(qiáng)大的 XNet 背后,用了最新的 Transformer 網(wǎng)絡(luò)架構(gòu),為了順利部署這套大模型網(wǎng)絡(luò),需要 50—100 萬的短視頻來進(jìn)行訓(xùn)練優(yōu)化,如果直接部署,不做優(yōu)化則需要吃掉超過一個(gè) Orin-X 的算力。
但是,這些視頻中動(dòng)態(tài)目標(biāo)的數(shù)量是以億為單位,如果以人工的方式進(jìn)行標(biāo)注,這至少需要 2,000 個(gè)人 1 年的時(shí)間。
為了解決這個(gè)問題,小鵬的自動(dòng)駕駛團(tuán)隊(duì)開發(fā)了一套「自動(dòng)標(biāo)注系統(tǒng)」,把標(biāo)注的時(shí)間壓縮到了 16.7 天。
然后是訓(xùn)練。
今年 8 月小鵬汽車宣布在烏蘭察布建成中國最大的自動(dòng)駕駛智算中心「扶搖」,用于自動(dòng)駕駛模型訓(xùn)練,算力達(dá)到 600 PFLOPS,效率相比原來提升了 602 倍。
接下來小鵬也會(huì)通過持續(xù)的「采集」、「標(biāo)注」、「訓(xùn)練」、「部署」來完善這套模型。
據(jù)吳新宙博士透露,目前小鵬有接近 10 萬輛用戶的車具備數(shù)據(jù)采集能力,并且在車端設(shè)置了超過 300 個(gè)觸發(fā)信號(hào),系統(tǒng)可以判斷當(dāng)前怎么樣的 Corner Case 是對(duì)系統(tǒng)有用的,然后進(jìn)行上傳,采集的數(shù)據(jù)包括車外的動(dòng)態(tài)、靜態(tài)物體,也包括全棧的數(shù)據(jù)。
最后,小鵬提出了一個(gè)新的概念「全場景輔助駕駛——XNGP」,相比現(xiàn)在的 XPilot,能力更強(qiáng),覆蓋范圍更廣,小鵬汽車的目標(biāo)是在無圖地區(qū)把城市 NGP 的體驗(yàn)做到無限接近于有圖地區(qū)。
再回到「應(yīng)該繼續(xù)打磨高速領(lǐng)航還是盡早上城市領(lǐng)航」這個(gè)話題,答案是顯而易見的,在現(xiàn)有技術(shù)路線下,雖然可以把城市導(dǎo)航輔助駕駛的體驗(yàn)打磨到一個(gè)比較好的狀態(tài),但是注定做不到城市領(lǐng)航輔助。
如果拿造房子來比喻,你的目標(biāo)是造一棟 100 層的摩天大樓,小鵬在做的是為了實(shí)現(xiàn) 100 層的高度,重構(gòu)可以支撐住的地基。
而還在打磨高速導(dǎo)航輔助駕駛的車企更像是在一個(gè)只能承載 3 層樓的地基,給這 3 層樓做了一個(gè)豪華的裝修,就算裝修得再好,仍然需要從地基開始重建。
今年 1024 的第二個(gè)重點(diǎn)是「全場景語音」。
在 2020 年小鵬汽車首次提出了全場景語音的概念,小鵬的目標(biāo)是將語音打造成新的交互方式,可以做到平替物理按鍵的效果。
在 2020 年這套系統(tǒng)已經(jīng)做到了「可見即可說」、「連續(xù)對(duì)話」、「多音區(qū)對(duì)話」等等,這些功能的出現(xiàn)把車載語音從一個(gè)不可用的狀態(tài)拉到了一個(gè)可用的狀態(tài),推出之后也相繼成為了許多車企模仿的對(duì)象,而今年,小鵬希望把語音從「可用」變?yōu)椤负糜谩埂?/p>
關(guān)于這套系統(tǒng)我們已經(jīng)在之前的試駕中做過詳細(xì)的體驗(yàn),可以給出的明確結(jié)論是:這是目前能力最強(qiáng)的一套語音系統(tǒng),也必將再次成為行業(yè)里追隨的對(duì)象。
具體的亮點(diǎn)可以總結(jié)為以下 4 點(diǎn)。
免喚醒
無論是車上的語音助手還是智能家居的語音助手,對(duì)于社恐的人來說,最大的使用門檻就是「喚醒」,載著一車人的時(shí)候,或者家里來朋友的時(shí)候,喚醒語音助手這一下總有巨大的阻力。
但是語音助手就不能做到免喚醒嗎?
可以,但很難。
有喚醒詞的情況下,系統(tǒng)可以非常清晰地知道,你的接下來的這句話是對(duì) ta 說的。
但是無喚醒詞的情況下,系統(tǒng)需要自己判斷你說的 10 句話中哪幾句是和副駕說的,哪幾句是和 ta 說的,這背后不僅需要系統(tǒng)具備出色的識(shí)別能力,更需要具備類似人類的語義判斷能力。
而在小鵬 G9 上,免喚醒語音支持全車 4 個(gè)座位。
多音區(qū)同時(shí)對(duì)話
在 2020 款理想 ONE 上我們第一次體驗(yàn)到了多音區(qū)語音,但是受限于算力和技術(shù),理想 ONE 的多音區(qū)只可以做到 4 路識(shí)別,1 路執(zhí)行,說白了就是全車最多只能 1 個(gè)人使用語音。
而在 G9 上,小鵬做到了 4 路,車上的 4 個(gè)人可以同時(shí)向小 P 發(fā)出指令,并且小 P 會(huì)同時(shí)執(zhí)行 4 個(gè)指令,這種感覺就像小 P 有了 4 個(gè)分身。
快
小鵬官方給出的數(shù)據(jù)是喚醒到界面反饋 245 ms、到語音反饋 700 ms。
在傳統(tǒng)的語音助手上,乘客需要說完指令,系統(tǒng)才會(huì)進(jìn)行識(shí)別,拿到識(shí)別的文本之后,再理解執(zhí)行。
在 G9 上,小鵬參考了人類的思考方式,⼩ P 可以⼀邊識(shí)別⽂本、⼀邊實(shí)時(shí)理解及查詢數(shù)據(jù),在乘客話剛說完⼀瞬間,所有理解已經(jīng)完成,這個(gè)就是流式理解。
這種邏輯下,交互的效率自然遠(yuǎn)高于上一種。
沒網(wǎng)也能用
現(xiàn)有的語音助手所有的文本識(shí)別均需要通過網(wǎng)絡(luò)上傳到云端處理,所以在高速、隧道、地庫等網(wǎng)絡(luò)不好的環(huán)境下,語音則是一個(gè)完全不可用的狀態(tài)。
基于 8155 芯片更大算力,小鵬在 G9 上實(shí)現(xiàn)了邊緣計(jì)算,依靠車端的算力既可以識(shí)別并執(zhí)行用戶的指令。
用一句話總結(jié)這四點(diǎn)目標(biāo)就是:降低人類的使用門檻。
看到 1024 發(fā)布會(huì)上小鵬城市 NGP 的規(guī)劃,我發(fā)了一條微博:「G9 Max 會(huì)在 2023 年上半年交付城市 NGP,首發(fā)城市有上海,就因?yàn)檫@個(gè)還挺想買 G9 的。」
隨后同事在評(píng)論區(qū)中寫到:「G9 的智能化非常有吸引力,但 G9 沒有!
仔細(xì)想想,雖然 G9 并不至于沒有吸引力,但是 G9 智能化的吸引力是大過于車的。
今年的 1024 是小鵬歷史上最硬核的一屆 1024,毫無疑問的是,小鵬的技術(shù)能力達(dá)到了一個(gè)全新的高度。
但比起往年,也是小鵬所處環(huán)境最復(fù)雜的一年,從最早的 G9 發(fā)布延期,到發(fā)布后的 SKU 調(diào)整,再到小鵬組織架構(gòu)的調(diào)整,每一個(gè)事件傳遞出來的都是小鵬在解決一個(gè)又一個(gè)的問題。
從悲觀的角度來看,小鵬現(xiàn)在確實(shí)存在很多問題,但是樂觀來看,當(dāng)小鵬解決掉一個(gè)又一個(gè)問題之后,小鵬也在變得越來越好。
就輔助駕駛現(xiàn)在的硬件成本和研發(fā)支出,在這個(gè)階段必然需要一輛「貴」的車來承載。
從 G9 的配置來看是完全撐得起這個(gè)價(jià)格的,甚至可以說很有性價(jià)比,但是當(dāng)價(jià)格超過 30 萬,品牌的段位是消費(fèi)者很難忽視的一個(gè)點(diǎn)。
E_Mail:vip@gxqcw.com 電話:15077070808 地址:南寧市青秀區(qū)濱湖路48號(hào)南湖聚寶苑D區(qū)15樓 桂ICP備06004827號(hào) 經(jīng)營許可證編號(hào):桂B(yǎng)2-20090044 |