一份端側(cè)AI的內(nèi)部紀(jì)要:投資人應(yīng)真正關(guān)心的3個(gè)被忽略的問題!
當(dāng)谷歌在Pixel 10上演示“實(shí)時(shí)AI摳圖”功能,以及蘋果預(yù)告將在2025秋季發(fā)布會(huì)推出“重新定義的AI手機(jī)”時(shí),從供應(yīng)鏈傳出的每一個(gè)風(fēng)聲,到華爾街連夜上調(diào)的出貨量預(yù)測,一個(gè)近乎完美的劇本已經(jīng)寫好:
一個(gè)由端側(cè)AI驅(qū)動(dòng)的、史詩級的消費(fèi)電子“超級升級周期”,即將到來。
但當(dāng)市場的喧囂散去,一個(gè)更冷靜、也更致命的問題浮現(xiàn)出來:
當(dāng)一個(gè)機(jī)會(huì)變得如此確定無疑,如果所有人都在談?wù)摱藗?cè)AI、所有芯片財(cái)報(bào)都在重復(fù)“On-Device AI”、所有品牌都在預(yù)告“革命性體驗(yàn)”,它會(huì)不會(huì)已經(jīng)變成了一個(gè)“共識陷阱”?
今天,硅兔君結(jié)合近期與其專家團(tuán)隊(duì)的交流成果就來聊聊共識之外,那三個(gè)決定未來勝負(fù)的“非共識”。
共識告訴你: 硬件環(huán)節(jié)確定性最高,是肉眼可見的紅利。
這個(gè)邏輯非常清晰。高通的驍龍8 Gen 3集成了Hexagon NPU,AI性能提升98%;聯(lián)發(fā)科的天璣9300號稱擁有330億參數(shù)大模型處理能力;蘋果的A17 Pro神經(jīng)引擎速度翻倍。
這場算力軍備競賽,直接體現(xiàn)在了產(chǎn)業(yè)鏈的財(cái)報(bào)上:瑞芯微、恒玄科技等公司的業(yè)績增長曲線,陡峭得讓人心動(dòng)。
這塊蜜糖,真實(shí)而甜美。但這會(huì)是常態(tài)嗎?
你需要追問的第一個(gè)非共識是:這場“算力內(nèi)卷”的盡頭是什么?
我們都經(jīng)歷過PC時(shí)代的CPU主頻大戰(zhàn),和智能手機(jī)早期的核戰(zhàn)。歷史一再證明,當(dāng)硬件性能超越了主流應(yīng)用的需求,就會(huì)出現(xiàn)“性能過剩”,硬件溢價(jià)隨之消失,行業(yè)進(jìn)入殘酷的存量搏殺。
今天手機(jī)NPU算力從50 TOPS卷到100 TOPS,除了讓AI修圖更快零點(diǎn)幾秒,對絕大多數(shù)用戶的體驗(yàn)改善,是否正在邊際遞減?一旦體驗(yàn)改善的曲線被算力增長的曲線追上,高昂的硬件溢價(jià)還能維持多久?
第二個(gè)更致命的問題是:誰在定義“有效算力”?
讓我們回顧一下NVIDIA是如何封神的。它的護(hù)城河,從來都不是GPU那塊芯片本身,而是CUDA——那個(gè)讓開發(fā)者欲罷不能的軟件開發(fā)生態(tài)。CUDA用十余年的時(shí)間,統(tǒng)一了AI開發(fā)的“語言”,讓數(shù)百萬開發(fā)者為NVIDIA的硬件“鎖定”。
真正的護(hù)城河,不是參數(shù)表上那個(gè)冷冰冰的TOPS數(shù)字,而是能讓開發(fā)者低成本、高性能地將算法跑起來的、充滿活力的軟件生態(tài)。
最后,別忘了手機(jī)之外的廣闊戰(zhàn)場。在智能汽車領(lǐng)域,Ambarella、瑞薩電子這類廠商,正通過高度定制化的AI視覺芯片(ASIC)搶占市場,它們不追求通用算力,而是在特定場景(如ADAS)下把能效比做到極致。這種“專用化”的降維打擊,是否會(huì)對手機(jī)芯片廠商“一芯多用”的平臺(tái)化策略構(gòu)成威脅?
硬件的戰(zhàn)爭,上半場是參數(shù),下半場是生態(tài)。當(dāng)你還在為那20%的溢價(jià)歡呼時(shí),真正聰明的錢,已經(jīng)在思考那個(gè)未來的生態(tài)霸主會(huì)是誰。
共識告訴你: 模型輕量化技術(shù),是讓大模型在終端設(shè)備運(yùn)行的關(guān)鍵。
沒錯(cuò)。通過模型剪枝、量化、知識蒸餾等一系列“手術(shù)”,百億參數(shù)的模型可以被壓縮到原來的十分之一,同時(shí)保持可接受的性能。我們已經(jīng)看到了Google的Gemini Nano被塞進(jìn)Pixel手機(jī),Meta的Llama 3也推出了適合端側(cè)運(yùn)行的小參數(shù)版本。
但這個(gè)過程,遠(yuǎn)比聽上去要復(fù)雜。
第一個(gè)被忽略的現(xiàn)實(shí)是:目前的模型壓縮,很大程度上還是個(gè)“手工作坊”。
它高度依賴頂尖AI科學(xué)家和工程師的經(jīng)驗(yàn)、直覺和反復(fù)試錯(cuò),俗稱“煉丹”。這個(gè)過程成本高昂、周期漫長,且結(jié)果難以保證。這極大地限制了端側(cè)AI應(yīng)用的創(chuàng)新速度和普及廣度。
真正的行業(yè)爆發(fā)點(diǎn),在于“自動(dòng)化模型壓縮”(AutoML for Compression)工具鏈的成熟。
想象一下,開發(fā)者不再需要是算法專家,只需將自己的大模型上傳到一個(gè)平臺(tái),平臺(tái)就能自動(dòng)嘗試數(shù)千種壓縮方案,并找到那個(gè)在特定硬件上(比如某款手機(jī)芯片)性能和精度的最佳平衡點(diǎn)。這才是“工業(yè)化”的革命。
一些嗅覺敏銳的初創(chuàng)公司,如Deci AI(被英偉達(dá)收購)、Neural Magic(被 RedHat收購),已經(jīng)在嘗試將這個(gè)過程產(chǎn)品化。這才是AI時(shí)代的未來,他們不生產(chǎn)模型,但他們讓所有模型都能更便宜、更高效地運(yùn)行在你的設(shè)備上。
第二個(gè)深水區(qū),是開源與閉源的路線之爭。以llama.cpp為代表的開源社區(qū),用驚人的速度,讓各種開源大模型在Mac、PC甚至手機(jī)上跑了起來,極大推動(dòng)了技術(shù)的普及。
但另一邊,蘋果和谷歌則在自己的操作系統(tǒng)里,內(nèi)置了高度優(yōu)化的、不對外的模型和推理引擎。
這像極了移動(dòng)互聯(lián)網(wǎng)的開端。未來,是安卓當(dāng)年對iOS的“開放戰(zhàn)勝封閉”重演,讓百花齊放的開源方案占領(lǐng)市場?還是巨頭憑借軟硬一體的極致體驗(yàn)和隱私保護(hù),牢牢守住高端生態(tài)位,賺取最高的利潤?這兩種路徑,指向了完全不同的產(chǎn)業(yè)鏈投資機(jī)會(huì)。
最后,是數(shù)據(jù)的“隱形戰(zhàn)爭”。 輕量化后的模型,性能或多或少會(huì)有損失。如何彌補(bǔ)?答案是“端側(cè)微調(diào)”(On-device Fine-tuning)。利用你在設(shè)備上的個(gè)人數(shù)據(jù),讓模型變得更懂你。
但這又引出了終極難題:如何在利用數(shù)據(jù)的同時(shí),絕對保護(hù)用戶隱私?聯(lián)邦學(xué)習(xí)(Federated Learning)等技術(shù)雖然被寄予厚望,但成熟度依然面臨挑戰(zhàn)。誰能率先解決“自動(dòng)化工具鏈”、“生態(tài)路線”和“隱私數(shù)據(jù)”這三個(gè)問題,誰就掌握了端側(cè)AI軟件的“命脈”。
共識告訴你: 手機(jī)、汽車、IoT是三大落地場景,前景無限。
這當(dāng)然是對的。但“場景”這個(gè)詞,最容易滋生泡沫。
第一個(gè)需要警惕的陷阱,就是“為了AI而AI”的功能堆砌。
還記得之前的Humane AI Pin和Rabbit R1嗎?它們被譽(yù)為“后智能手機(jī)時(shí)代”的硬件,但上市后的市場反應(yīng)卻相當(dāng)冷淡。
為什么?因?yàn)樗鼈儧]有找到一個(gè)無可替代的“殺手級應(yīng)用”。用戶不會(huì)為炫酷的技術(shù)概念買單,只會(huì)為它實(shí)實(shí)在在解決的問題付費(fèi)。
現(xiàn)在手機(jī)上的AI消除路人、AI生成壁紙,汽車?yán)锏恼Z音助手,是很好,但它們是能讓你下定決心多花2000塊錢的理由嗎?恐怕還不夠。
第二個(gè)需要建立的認(rèn)知框架是:“殺手級應(yīng)用”的三個(gè)演進(jìn)層次。
層次1 - 增強(qiáng)(Co-pilot): 這是目前的主流。無論是幫你潤色郵件,還是實(shí)時(shí)翻譯,AI的角色是你的“副駕駛”,提升現(xiàn)有任務(wù)的效率。這個(gè)層次的應(yīng)用價(jià)值在于“更好”,而非“從無到有”。
層次2 - 代理(Agent): 這才是未來的趨勢。當(dāng)你能對手機(jī)說,“幫我訂一張明晚去上海的機(jī)票,找一家徐家匯附近評分4.5以上的酒店,然后把行程發(fā)給我老婆”,而它能自主調(diào)用航旅App、地圖App、微信來完成這一切時(shí),革命才真正發(fā)生。這是對現(xiàn)有App孤島生態(tài)的徹底顛覆,也是對操作系統(tǒng)入口的終極爭奪。
層次3 - 預(yù)判(Guardian): 這是AI與個(gè)人數(shù)據(jù)深度結(jié)合的終極形態(tài)。它不再是被動(dòng)響應(yīng),而是主動(dòng)服務(wù)。比如你的智能手表在你心臟出現(xiàn)異常搏動(dòng)前幾小時(shí)發(fā)出預(yù)警,你的智能家居在你回家前就調(diào)節(jié)到你最舒服的狀態(tài)。這個(gè)層次的應(yīng)用,壁壘最高,用戶粘性也最強(qiáng)。
由此,引出了那個(gè)價(jià)值萬億的終極拷問:價(jià)值最終歸屬于誰?
如果一個(gè)AI Agent幫你完成了所有事,那么,是這個(gè)Agent的開發(fā)者(比如一家新的超級App公司)賺走了大部分利潤?還是提供底層能力和分發(fā)渠道的操作系統(tǒng)(蘋果/谷歌)來“收稅”?那些被它調(diào)用的傳統(tǒng)App,又將淪為“管道”還是能分一杯羹?
這將是科技史上規(guī)?涨暗囊粓“價(jià)值重分配”。投資端側(cè)AI,你本質(zhì)上是在對未來的人機(jī)交互形態(tài),以及這場價(jià)值分配的最終格局下注。
你看,從共識到非共識,我們只多問了三個(gè)問題。
但這三個(gè)問題,恰恰是區(qū)分平庸和卓越的試金石。
原文標(biāo)題 : 一份端側(cè)AI的內(nèi)部紀(jì)要:投資人應(yīng)真正關(guān)心的3個(gè)被忽略的問題!

發(fā)表評論
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬億刺激”計(jì)劃來了
- 6 2025年8月人工智能投融資觀察
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長曲線
- 8 9 a16z最新AI百強(qiáng)榜:硅谷頂級VC帶你讀懂全球生成式AI賽道最新趨勢
- 10 Manus跑路,大廠掉線,只能靠DeepSeek了