
- XPENG-北大研究突破: XPENG與北京大學合作,開發了FastDriveVLA——一個新穎的視覺token剪枝框架,使自動駕駛AI能夠「像人類一樣駕駛」,僅專注於關鍵資訊,從而實現了計算負載降低7.5倍。
- 頂級AI認可: 該研究已被全球頂級AI會議之一AAAI 2026接收,今年其錄取率極具選擇性,僅為17.6%。
- 加速L4級自動駕駛: 此項成就彰顯了XPENG在AI驅動出行領域的全棧能力,並推動業界朝著高效、可擴展部署下一代自動駕駛系統的方向邁進。
(SeaPRwire) – 中國廣州, 2025年12月28日 — XPENG與北京大學合作的論文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》已被全球頂級人工智慧會議AAAI 2026接收。AAAI 2026共收到23,680篇投稿,僅錄取4,167篇,錄取率僅為17.6%。
該論文介紹了FastDriveVLA,這是一個專為端到端自動駕駛視覺-語言-行動(VLA)模型設計的高效視覺token剪枝框架。這項工作提供了一種新的視覺token剪枝方法,使AI能夠「像人類一樣駕駛」,僅專注於必要的視覺資訊,同時過濾掉不相關的數據。
隨著AI大模型快速發展,VLA模型因其在複雜場景理解和行動推理方面的強大能力,正被廣泛應用於端到端自動駕駛系統中。這些模型將圖像編碼為大量的視覺token,作為模型「看見」世界並做出駕駛決策的基礎。然而,處理大量token會增加車載計算負載,影響推理速度和即時性能。
雖然視覺token剪枝已被認為是加速VLA推理的可行方法,但現有方法,無論是基於文本-視覺注意力還是token相似度,在駕駛場景中都顯示出局限性。為了解決這個問題,XPENG與北京大學開發了FastDriveVLA,這是一個新穎的基於重建的token剪枝框架,其靈感來自人類駕駛員專注於相關前景資訊而忽略非關鍵背景區域的方式。
該方法引入了一種對抗性的前景-背景重建策略,增強了模型識別和保留有價值token的能力。在nuScenes自動駕駛基準測試中,FastDriveVLA在各種剪枝比例下均實現了最先進的性能。當視覺token數量從3,249個減少到812個時,該框架在保持高規劃準確性的同時,實現了近7.5倍的計算負載降低。
這是XPENG今年第二次獲得全球頂級AI會議的認可。今年六月,XPENG是唯一受邀在CVPR WAD發言的中國汽車製造商,分享了其在自動駕駛基礎模型方面的進展。在11月的AI Day上,XPENG發佈了VLA 2.0架構,該架構移除了「語言翻譯」步驟,實現了直接從視覺到行動的生成,這項突破重新定義了傳統的V-L-A流程。
這些成就反映了XPENG從模型架構設計、訓練到蒸餾和車輛部署的全棧自研能力。展望未來,XPENG仍致力於實現L4級自動駕駛,以加速實體AI系統與車輛的整合,目標是為全球用戶提供安全、高效且舒適的智慧駕駛體驗。
關於 XPENG
XPENG致力於透過技術探索引領未來出行變革,定位為「未來出行探索者」。公司總部位於中國廣州,在北京、上海、深圳、肇慶和揚州設有研發中心,並在肇慶和廣州建立了智慧製造基地。
XPENG推行研發與銷售的全球化策略,在美國設有研發中心,並在歐洲多個國家設有子公司。公司堅持智慧駕駛輔助軟體的全棧自研以及核心硬體的開發,為用戶提供卓越的智慧駕駛與乘坐體驗。
2020年8月27日,XPENG正式在紐約證券交易所掛牌上市(NYSE: XPEV),其IPO募資額當時創下了全球新能源汽車行業的紀錄。2021年7月7日,公司在香港聯合交易所掛牌上市(HKEX: 9868),成為首個在紐約和香港雙重主要上市的中國新能源汽車製造商。
欲了解更多資訊,請造訪 。
聯絡方式:
媒體查詢:Alison Liang, XPENG公關部
電子郵件:
消息來源 XPENG
本文由第三方廠商內容提供者提供。SeaPRwire (https://www.seaprwire.com/)對此不作任何保證或陳述。
分類: 頭條新聞,日常新聞
SeaPRwire為公司和機構提供全球新聞稿發佈,覆蓋超過6,500個媒體庫、86,000名編輯和記者,以及350萬以上終端桌面和手機App。SeaPRwire支持英、日、德、韓、法、俄、印尼、馬來、越南、中文等多種語言新聞稿發佈。