侵權投訴
訂閱
糾錯
加入自媒體

3000TOPS算力+二代VLA!小鵬首款量產Robotaxi全場景駕駛真能行?

2025-11-07 13:41
芝能科技
關注

芝能科技出品

在小鵬科技日上,我們看到了第二代VLA(Vision-Latent-Action)技術,從視覺直接生成動作的「端到端」控制邏輯,進入「物理世界大模型」的階段。

在此基礎上,小鵬進一步推出首款基于VLA架構的Robotaxi,以前裝量產、純視覺路線、全球泛化能力為基礎,從自己的角度準備切入 Robotaxi的新體系。 

01

VLA的技術 

輔助駕駛行業(yè)主流模型普遍采用“視覺→語言→動作”的VLA路徑,通過語言作為中間層,將駕駛場景以自然語言的形式進行描述,再將語言信息轉譯為控制決策。

◎ 優(yōu)點在于通用性強,便于模型理解復雜語義;

◎ 局限也極為明顯:語言并非為機器推理而生,而是為人類溝通而設計。

在高動態(tài)、細微變化頻繁的駕駛環(huán)境中,語言的抽象性反而成為一種信息損耗。車輛的微小偏轉、道路材質的變化、行人姿態(tài)的細節(jié),都可能在語言轉譯過程中被忽略。

小鵬第二代VLA選擇的路線,去除語言中介,實現「視覺→隱式Token→動作」的架構。

模型直接從海量真實駕駛視頻中學習,在無監(jiān)督的條件下構建出對物理世界的自主理解,系統(tǒng)不僅能“看”,還能“感”,通過直接學習物理交互規(guī)律來理解世界運行方式,從而形成一種“物理直覺”。

小鵬自研的圖靈AI芯片突破了以GPU為核心的傳統(tǒng)架構,采用NPU(神經網絡處理器)設計,針對Transformer網絡進行算子級優(yōu)化。

小鵬在云端構建的全球領先智算集群——總規(guī)模超過3萬張計算卡,部署720億參數的基座大模型,云端至車端的全鏈路可在五天內完成一次迭代,模型能以極高的頻率自我優(yōu)化,在端側保持快速適應性與實時進化能力。

02

從VLA到Robotaxi 

基于第二代VLA架構,小鵬推出中國首款全棧自研量產Robotaxi,小鵬Robotaxi采用“前裝一體化”方案,車輛在出廠時已預埋兩套獨立冗余硬件系統(tǒng),包括算力、視覺、剎車、轉向、電池、通訊等六大模塊,保證了L4級自動駕駛的安全冗余。

小鵬Robotaxi完全依托純視覺方案,不依賴高精地圖或激光雷達,感知系統(tǒng)與決策模型均由VLA直接驅動,通過模型自身對環(huán)境的泛化理解實現全場景駕駛覆蓋。

方案能夠在全國甚至全球范圍運行,適應不同的交通法律與習慣,“泛化自適應”能力,使其具備跨地域擴展的潛力,成為真正意義上的“通用出行智能體”。

在交互層面,小鵬也為Robotaxi賦予了全新的“表達能力”。

通過首創(chuàng)的“遮陽板車外顯示系統(tǒng)”,車輛可以在泊車、臨停、迎賓、充電等場景中,以視覺符號或語音與外界進行交流。例如,當行人靠近時,車輛的“眼睛”會張開表示注視;遇到交警時,會顯示“車主馬上回來”的提示。

這種多模態(tài)交互不僅提升了安全性,也在心理層面建立了人與車之間的信任。

小鵬Robotaxi還接入了“AI任務臺”云端平臺,實現云-車雙向互聯。平臺可遠程下發(fā)任務、指令或應對突發(fā)情況,并通過AI算法進行決策閉環(huán),從而避免傳統(tǒng)遠程人工接管的延遲與風險。整體系統(tǒng)在保證安全冗余的同時,保持了高度的實時性與自主性。

從成本角度來看,小鵬的“前裝一體化”設計讓成本有所變化,也使規(guī)模化運營成為可能,首批合作方高德地圖,將直接接入小鵬Robotaxi的全球生態(tài)接口,為其建立出行入口和商業(yè)化基礎。

小鵬計劃在2026年啟動城市級示范運營,并同步推出三款Robotaxi車型。其最高配版本小鵬Robo,將搭載四顆圖靈AI芯片,總算力達到3000 TOPS,具備L4級自動駕駛能力。 

小結

小鵬科技日上第二代VLA和Robotaxi值得關注。

       原文標題 : 3000TOPS算力+二代VLA!小鵬首款量產Robotaxi全場景駕駛真能行?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號