端到端類腦自動駕駛 | DeepSeek如何影響國內(nèi)智能汽車行業(yè)
本文來源:智車科技
國內(nèi)智能汽車行業(yè)正經(jīng)歷一場由AI驅(qū)動的技術(shù)變革,而DeepSeek憑借其開源生態(tài)與高效訓練能力,迅速引起國內(nèi)車企的共情和合作。在傳統(tǒng)汽車向“軟件定義汽車”轉(zhuǎn)型的浪潮下,車聯(lián)網(wǎng)、自動駕駛等技術(shù)的迭代對算力與研發(fā)成本提出了更高要求。
開源+高效訓練
車企擁抱DeepSeek的底層邏輯
DeepSeek的開源模式為汽車行業(yè)提供了新思路。
2月6日,吉利汽車宣布自研大模型星睿與DeepSeek已完成深度融合。吉利將對星睿車控FunctionCall大模型、汽車主動交互端側(cè)大模型等進行蒸餾訓練。屆時,吉利智能汽車AI不僅能對用戶的模糊意圖實現(xiàn)精準理解,進而準確調(diào)用約2000個車載接口,還能基于車內(nèi)外場景主動分析用戶潛在需求,并為用戶主動提供車輛控制、主動對話、售后等服務,智能交互體驗將大幅提升。
2月7日,嵐圖汽車旗下車型嵐圖知音完成與DeepSeek模型的深度融合,成為汽車行業(yè)首個搭載該技術(shù)的量產(chǎn)車型。此前,嵐圖座艙已完成DeepSeek全系列模型接入和部署,AI智能體將在云端與DeepSeek大模型融合,帶來精準智能交互體驗。
圖1 吉利凌渡座艙,搭載吉利與DeepSeek整合AI模型
業(yè)界的普遍共識是,汽車行業(yè)正在從傳統(tǒng)的電動汽車(EVs)向智能電動汽車(EIVs)演變。AI和云計算正在推動新能源汽車競爭力。AI和云計算的整合已成為中國新能源汽車(NEV)市場的一個重要趨勢。汽車制造商正在利用這些技術(shù)提升車輛性能,為用戶提供更個性化的駕駛體驗。
在近期于達沃斯舉行的世界經(jīng)濟論壇上,寧德時代聯(lián)席主席潘健強調(diào),智能與中國電動汽車市場的快速增長密不可分。他表示,電力和智能的無縫整合是這一轉(zhuǎn)型的關(guān)鍵。他強調(diào),電動力為汽車提供了先進的智能功能,結(jié)合DeepSeek類大模型,將進一步鞏固了中國在全球智能電動汽車領域的領導地位。
在追求模型高效落地的過程中,蒸餾(Distillation)技術(shù)成為DeepSeek賦能車企的另一張王牌。傳統(tǒng)大模型雖性能強悍,但高昂的存儲與運行成本使其難以適配車載場景。DeepSeek R1通過知識蒸餾,將大型語言模型的“經(jīng)驗”遷移至輕量化模型中,既保留了核心能力,又大幅降低了硬件負載。據(jù)悉,吉利將對星睿車控 FunctionCall 大模型、汽車主動交互端側(cè)大模型等進行蒸餾訓練,將DeepSeek R1的語義理解與優(yōu)先級決策能力注入車輛控制模塊,這種“類人思考”的決策邏輯,將為車企在成本與性能間找到了平衡點,加速了AI模型從實驗室到量產(chǎn)車的轉(zhuǎn)化。
DeepSeek在智能車輛行業(yè)的未來擴展
-類腦思考的端到端自動駕駛
在自動駕駛領域,還沒有自動駕駛模型在大數(shù)據(jù)統(tǒng)計檢驗意義上公認優(yōu)于人類駕駛員。如何讓機器理解“人類用語義表達的操作優(yōu)先級”,這正是DeepSeek和其它潛在大語言模型最好的切入點之一。而且,這種技術(shù)切入是融合到最新的端到端(end to end)自動駕駛技術(shù)潮流的。
圖2 三階段和端到端自動駕駛對比,圖片來自Research Gate
傳統(tǒng)的自動駕駛系統(tǒng)通常由多個獨立的模塊或者階段組成,如感知、決策和控制。而端到端自動駕駛技術(shù)試圖通過將這些模塊整合成一個統(tǒng)一的龐大神經(jīng)網(wǎng)絡模型,直接將原始傳感器輸入(圖像、點云、超聲波雷達等等)映射到車輛的控制命令,以實現(xiàn)自動駕駛的功能。
具體而言,端到端自動駕駛技術(shù)將原始傳感器數(shù)據(jù)(如攝像頭、雷達和激光雷達)作為輸入,并通過深度學習網(wǎng)絡進行處理,直接輸出車輛的控制命令(如方向盤轉(zhuǎn)角、油門和剎車)。這種方法消除了傳統(tǒng)自動駕駛系統(tǒng)中的中間步驟和模塊,簡化了系統(tǒng)的設計和實施過程。
端到端自動駕駛技術(shù)的主要優(yōu)勢在于它可以通過使用大規(guī)模的數(shù)據(jù)集進行端到端的訓練,從而提高系統(tǒng)的性能和魯棒性。它能夠從原始數(shù)據(jù)中學習到更高級別的特征和抽象表示,自動發(fā)現(xiàn)和理解復雜的交通場景和駕駛行為。此外,端到端自動駕駛技術(shù)還能夠適應不同的道路和環(huán)境條件,具有更好的泛化能力。
端到端自動駕駛技術(shù)有許多潛在的優(yōu)勢,但它的優(yōu)勢面也同步帶來對應的劣勢,如對大規(guī)模數(shù)據(jù)的需求、對計算資源的要求以及解釋性和安全性等問題。其中最大的潛在劣勢是最終結(jié)果的統(tǒng)一單一模型可能極為龐大,帶來巨大的存儲、訓練,運行開銷和巨大的能耗。因此,盡管業(yè)界普遍接受端到端方案是自動駕駛的未來,但主要實踐端到端自駕的還是巨頭Tesla。
一般而言,作為現(xiàn)狀的當前自動駕駛系統(tǒng)通常采用混合方法,結(jié)合傳統(tǒng)的模塊化方法和端到端技術(shù),以實現(xiàn)更可靠和安全的自動駕駛功能。
那么如果有一個破局者,具有低訓練成本、低使用成本,最終模型采用蒸餾distillation技術(shù)極小化,又能理解“人類用語義表達的操作優(yōu)先級”如何呢?
這個回答似乎是訓練費用560w美元,單個token使用費用約chatGPT o1的三十分之一,且不依賴海外高端芯片的DeepSeek R1,以及它的多模態(tài)前身DeepSeek V3。
圖3 學術(shù)界使用多模態(tài)大語言模型LLM處理自動駕駛傳感器輸入的多模態(tài)數(shù)據(jù)(來自next-GPT)
隨著智能駕駛向“全場景化”邁進,端到端(End-to-End)技術(shù)成為行業(yè)競爭的高地。傳統(tǒng)自動駕駛依賴感知、決策、控制分階段執(zhí)行的模塊化架構(gòu),存在系統(tǒng)復雜、響應延遲等短板。DeepSeek通過多模態(tài)大模型,將傳感器數(shù)據(jù)直接映射為控制指令,構(gòu)建起“輸入-輸出”一體化的新范式。
以DriveGPT4、商湯DriveAGI、Senna架構(gòu)為代表的端到端方案,已展現(xiàn)出顯著優(yōu)勢。
1.DriveGPT4:DriveGPT4是將大模型應用于可解釋的端到端自動駕駛的一個重要里程碑。它通過引入更強大的感知能力和更高的決策透明度,推動了自動駕駛技術(shù)向更加智能的方向發(fā)展。
2.Senna架構(gòu):Senna采用了獨特的解耦行為決策-軌跡規(guī)劃思路,利用大規(guī)模駕駛數(shù)據(jù)進行微調(diào),以增強對駕駛場景的理解能力。此外,該架構(gòu)還能通過自然語言輸出高維決策指令,進一步提升了系統(tǒng)的靈活性和適應性。
3.商湯絕影DriveAGI:商湯絕影推出的新一代自動駕駛大模型DriveAGI,憑借其寬泛適用場景、高性能以及低門檻的特點,成為行業(yè)內(nèi)的一大亮點。該模型特別注重增強端到端自動駕駛方案的可解釋性和交互能力
除此以外,我們還可以再加上前文提到的吉利將自身AI模型和deepseek整合得到混合模型。
也許近期就會出現(xiàn)DeepSeek獨立的Driving AGI,這些模型在技術(shù)架構(gòu)上都一般包含如下特點作為基礎部件:
1.多模態(tài)數(shù)據(jù)融合:
多模態(tài)大模型能夠處理來自不同傳感器的數(shù)據(jù),如攝像頭、激光雷達(LiDAR)、毫米波雷達等。這些數(shù)據(jù)被整合成一個統(tǒng)一的表示形式,從而為后續(xù)的決策和規(guī)劃提供全面的信息支持。
2.端到端學習:
端到端學習是指從原始傳感器數(shù)據(jù)直接輸出駕駛指令或軌跡規(guī)劃的過程。這種方式省去了傳統(tǒng)方法中復雜的中間步驟,簡化了系統(tǒng)設計,并提高了系統(tǒng)的實時性和魯棒性。例如,EMMA(End-to-End Multimodal Model for Autonomous Driving)技術(shù)可以直接將原始攝像頭數(shù)據(jù)映射到具體的駕駛動作。
3.自然語言處理與交互:
一些先進的多模態(tài)大模型不僅限于視覺信息,還結(jié)合了自然語言處理能力,可以理解并生成人類語言描述的駕駛意圖或指令。這使得系統(tǒng)能夠更好地理解和響應復雜環(huán)境中的動態(tài)變化,同時也增強了人機交互的可能性。
其應用場景包括:
1.乘用車自動駕駛:在城市道路、高速公路等多種路況下,多模態(tài)大模型可以幫助車輛安全地完成變道、避障、停車等操作。據(jù)報道,理想汽車已經(jīng)基于快慢雙系統(tǒng)的思路實現(xiàn)了量產(chǎn)上車的應用。
2.商用車及物流配送:商用車輛和物流配送機器人不僅可以在NOA模式下使用多模態(tài)大模型實現(xiàn)L1-L4級別自駕,特別是在面對非結(jié)構(gòu)化環(huán)境時,如港口(比如東風商用車和招商集團合作的廈門港、媽灣港無人集卡)、礦區(qū)(遠安磷礦地下礦區(qū)自動礦車)、工地、倉庫內(nèi)部等特殊場景。這些模型能夠提高運輸效率,減少人為干預的需求,減少司乘人員的精力消耗。
結(jié)語
值得關(guān)注的是,DeepSeek通過開源生態(tài)與高效訓練框架,正在打破特斯拉對端到端技術(shù)的壟斷。其模型支持分布式訓練與邊緣計算部署,即便在國產(chǎn)芯片上也能實現(xiàn)低延遲推理。隨著蒸餾技術(shù)的進一步優(yōu)化,未來車載模型的體積與能耗有望再降,為L4級自動駕駛的規(guī);涞劁伷降缆。
從開源賦能到蒸餾提效,再到端到端重構(gòu)駕駛邏輯,DeepSeek正在以“技術(shù)普惠”的姿態(tài)重塑國內(nèi)智能汽車行業(yè)。在這場變革中,車企借助AI大模型的“智力杠桿”,實現(xiàn)安全、高效與人性化駕駛體驗的全面升級。當DeepSeek的“類腦思考”真正融入車輪之上,中國智能汽車產(chǎn)業(yè)的全球領導地位或?qū)⒉辉龠b遠。
免責聲明:
凡本公眾號注明“來源:XXX(非智車科技)”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞和分享更多信息,并不代表本平臺贊同其觀點和對其真實性負責,版權(quán)歸原作者所有,如有侵權(quán)請聯(lián)系我們刪除。
原文標題 : 端到端類腦自動駕駛 | DeepSeek如何影響國內(nèi)智能汽車行業(yè)

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?