vivo過去多年在手機技術(shù)上的積累,正在成為其進軍家庭機器人賽道的底氣。
文|游勇
編|周路平
01
vivo的下一站,家庭機器人
隨著幾條百萬年薪的招聘信息被披露,vivo進軍家庭機器人賽道的消息不脛而走。
從這些招聘網(wǎng)站流出的消息,vivo在積極網(wǎng)羅機器人方向的人才,包括機器人首席科學(xué)家、機器人技術(shù)規(guī)劃專家等崗位,并且為這些崗位開出了豐厚的薪酬,比如技術(shù)規(guī)劃專家的最高年薪超過了120萬元。
3月25日,在博鰲亞洲論壇2025年年會現(xiàn)場,vivo執(zhí)行副總裁、首席運營官胡柏山也親自證實了這一消息,vivo已成立了機器人Lab。該部門隸屬于vivo中央研究院,主要負(fù)責(zé)機器人產(chǎn)品的孵化與預(yù)研工作。
事實上,機器人是一個需求非常龐大的市場,隨著人口老齡化的趨勢越來越明顯,無論是做家務(wù),還是情感陪伴,抑或是教育監(jiān)護,家用機器人的價值和潛力都被外界所看好。早在2021年發(fā)布的《“十四五”機器人產(chǎn)業(yè)發(fā)展規(guī)劃》中,國家就將家庭服務(wù)機器人作為重點發(fā)展領(lǐng)域之一。
而vivo在機器人賽道上的定位非常清晰,將其服務(wù)數(shù)億終端用戶的能力移植到機器人。胡柏山說,依托于vivo“藍科技”在AI大模型與影像領(lǐng)域的十年深厚積累,疊加vivo Vision混合現(xiàn)實頭顯積累的實時空間計算能力,vivo會聚焦孵化機器人的“大腦”和“眼睛”,讓機器人可以“看得懂場景,聽得懂需求,給得了回應(yīng)”。
不過,通用型的消費級機器人需要很長的演進過程。根據(jù)vivo的產(chǎn)品節(jié)奏,預(yù)計三到五年出原型機,正式推出人們理想中的家庭機器人可能需要10年以上。胡柏山將其形容為“漸進突圍、沿途下蛋”,比如vivo不排除會針對一些特定的用戶場景推出一些具備針對性能力的機器人產(chǎn)品。
但在具體形態(tài)上,機器人是否要做成人形,在業(yè)內(nèi)一直存有爭議。比如特斯拉非常在意人形,Optimus機器人全面模擬了人的形態(tài)。但蘋果在進入機器人賽道時,就明確表示更關(guān)注“用戶如何感知機器人”,不會糾結(jié)于是否具有擬人化的外觀。
對vivo而言,做機器人產(chǎn)品的核心是圍繞用戶場景的真實需求,至于何種產(chǎn)品形態(tài),更多是行業(yè)自然進化的結(jié)果。
02
vivo憑什么切入新賽道
很多人好奇,vivo作為手機廠商切入這一賽道,會有什么優(yōu)勢?
眾所周知,手機更多是對二維世界的交互,而機器人則考驗的是對物理世界的3D空間感知能力。其實過去多年在手機技術(shù)上的積累,正是vivo進軍機器人賽道的“底氣”。
AI被認(rèn)為是機器人最核心的能力。大模型的演進,不僅能讓機器人更理解人類語言和意圖,也能更加高效地對物理環(huán)境進行感知,為機器人的自主感知和執(zhí)行能力打下基礎(chǔ)。
英偉達的黃仁勛說, “人工智能的下一個前沿是物理AI”。
而機器人是物理AI的集大成者。過去,傳統(tǒng)的機器人依賴預(yù)設(shè)程序執(zhí)行任務(wù),每一個新場景下的新動作,都需要大量的數(shù)據(jù)學(xué)習(xí),而且成功率不高,不同形態(tài)之間的機器人也無法共享數(shù)據(jù)。
AI尤其是大模型的優(yōu)勢是,具備自學(xué)習(xí)能力和泛化性,而機器人具備大量的傳感器和執(zhí)行設(shè)備,能夠感知環(huán)境、學(xué)習(xí)和自主決策,未來的AI+機器人將不僅僅是陪你聊天,幫你畫一張圖,而是能在真實的世界中,幫你提高生活質(zhì)量和工作效率。
另外,手機由于自身的算力和形態(tài)的局限,短時間內(nèi)還很難充分發(fā)揮AI的能力,比如目前只能運行3B左右的端側(cè)大模型,而機器人沒有這方面的限制,甚至可以像電腦一樣加風(fēng)扇和外設(shè),能夠跑參數(shù)更大的模型。所以,機器人也被認(rèn)為是一個更加貼合AI演進的終端形態(tài)。
vivo機器人Lab的一個重要子任務(wù)就是對AI Agent能力的訓(xùn)練,這也將成為vivo未來機器人的大腦。
AI一直是vivo重點投入的領(lǐng)域。vivo很早就成立了AI全球研究院,并且發(fā)布了自研的藍心大模型矩陣,不僅有語言大模型,也有語音、圖像和多模態(tài)大模型,這些能力已經(jīng)在手機等終端設(shè)備上得以應(yīng)用。
比如vivo曾推出過一項幫助視障人群的無障礙功能——vivo看見,它可以提供環(huán)境描述、AI環(huán)境實時問答、物品查找,而其底層是基于藍心大模型的視覺理解能力,能夠讓視障人士與物理世界無障礙地溝通和交互。而未來,這項能力也可以用于機器人的視覺識別上。
除了擁有一個智慧的大腦,對三維世界的空間感知能力扮演著機器人的雙眼角色。而攝像頭又是構(gòu)建空間數(shù)據(jù)必不可少的一個傳感器。
這恰恰是vivo的強項,vivo多年來在影像上的布局給空間感知上打下了很好的基礎(chǔ)。比如當(dāng)年為了提升手機的影像能力,vivo自研了影像芯片,采用了多并發(fā)AI感知架構(gòu)。
而早在2018年,vivo就首發(fā)了TOF超感應(yīng)3D技術(shù)。2020年發(fā)布的vivo X50 Pro,搭載了行業(yè)首個超小型防抖微云臺,可以為機器人這種移動設(shè)備提供更好的穩(wěn)定性。2022年,vivo首發(fā)了自研的VCS仿生光譜技術(shù),讓圖像傳感器從接收圖像信息階段就具備更好的噪聲表現(xiàn)和色彩還原。
而2024年發(fā)布的vivo X100 Ultra,成為首款支持3D影像的安卓手機。而這種3D空間影像是機器人與物理世界交互的關(guān)鍵,能讓機器人更精準(zhǔn)的定位和導(dǎo)航避障。
這也是vivo率先做混合現(xiàn)實頭顯的出發(fā)點。MR和機器人同屬于一棵科技樹,上面的果實或許形態(tài)各異,但底層的技術(shù)邏輯卻有相通性。
MR產(chǎn)品通過在現(xiàn)實環(huán)境中引入數(shù)字對象、信息和虛擬角色等方式,為物理世界創(chuàng)造出一種新的可視化環(huán)境,已經(jīng)成為機器人必不可少的技術(shù),市面上不少機器人項目都引入了MR的技術(shù)。
而根據(jù)vivo的思路,vivo先推出混合現(xiàn)實頭顯產(chǎn)品,積累針對空間識別的感知能力和機器人多樣化的交互能力。這也意味著vivo做混合現(xiàn)實頭顯產(chǎn)品,其實是為未來演進到機器人這種產(chǎn)品形態(tài)打下技術(shù)基礎(chǔ)。換句話說,vivo Vision混合現(xiàn)實頭顯只是vivo做家庭機器人的一個跳板,vivo的星辰大海是做通用型的消費級家庭機器人。
其實,除了手機技術(shù)在機器人賽道的復(fù)用,vivo近些年已經(jīng)在為家庭機器人的研發(fā)做著技術(shù)準(zhǔn)備。
比如在2024年9月,vivo公開了一項名為“機器人及其控制方法”的專利,主要用于解決相關(guān)技術(shù)中涉及的天線難以應(yīng)對通信環(huán)境的變化,導(dǎo)致機器人的通信靈活性以及通信性能較差的問題。11月,vivo又公開了一項名為“基于混合現(xiàn)實的交互方法、裝置及電子設(shè)備”的專利。
另外,vivo也在開始提前布局6G通信。由于機器人本體的計算能力有限,依然需要依賴強大的云端算力,這需要機器人與云端的連接,而網(wǎng)絡(luò)的速率將在其中起到關(guān)鍵作用。6G將在未來機器人的場景中扮演著重要角色。
不難發(fā)現(xiàn),從底層的芯片硬件,到上層的軟件優(yōu)化,在正式進軍機器人賽道之前,vivo就已經(jīng)在手機時代逐步進行著技術(shù)的原始積累。尤其是在人工智能和空間感知等相關(guān)技術(shù)的積累,將成就vivo在機器人賽道的先發(fā)優(yōu)勢。
03
手機廠商的下一個星辰大海
在vivo決心投身機器人賽道的背后,蘋果三星等一眾手機大廠也動作頻頻。
不久,已經(jīng)決心放棄造車計劃的蘋果,被曝出將下一個產(chǎn)品重心放在了機器人賽道。根據(jù)分析師郭明錤透露的消息,蘋果已組建一個數(shù)百人的團隊,開發(fā)面向消費者的家用機器人,而這些產(chǎn)品目前還處于概念驗證(POC)階段,預(yù)計到2028年實現(xiàn)量產(chǎn)。
蘋果也已經(jīng)在為機器人業(yè)務(wù)積累相關(guān)的技術(shù),包括與卡內(nèi)基梅隆大學(xué)提出了一套機器人自我中心感知系統(tǒng)(ARMOR),通過軟、硬件協(xié)同增強機器人的“空間意識”,提升人形機器人的避障與運動規(guī)劃能力。
更早之前的三星,推出了家庭服務(wù)機器人Bot Handy,它采用了輪式設(shè)計,能夠識別和拾取不同大小、形狀和重量的物體,完成清理房間、擺放食品等工作,比如分類衣物、倒酒、擺盤等。而在不久前的CES上,三星展示了一個形似保齡球的伴侶機器人Ballie,它不僅能語音控制家居設(shè)備,也可以遠程指揮它遙控寵物喂食機、檢查寵物狀態(tài)等。
在手機進入存量市場的當(dāng)下,機器人行業(yè)展現(xiàn)了另外一幅熱鬧景象。
有數(shù)據(jù)顯示,截至2024年12月底,全國共有45.17萬家智能機器人產(chǎn)業(yè)企業(yè)。機器人的創(chuàng)業(yè)公司融資額和融資數(shù)量不斷創(chuàng)下新高,而在二級市場,機器人概念股被熱炒。在AI的推動下,機器人行業(yè)正在走向爆發(fā)的臨界點。
正如科大訊飛劉慶峰說,基于深度學(xué)習(xí)與自然語言處理技術(shù)的突破,AI陪伴型機器人有望在三年左右進入普通家庭,并成為老齡化社會的重要支持工具。
而手機廠商集體瞄準(zhǔn)這一賽道背后,除了其龐大的規(guī)模和用戶需求,背后還有一個更深層次的邏輯。
正如vivo胡柏山所說:“手機行業(yè)是中國科技創(chuàng)新的縮影,而機器人是手機行業(yè)的未來,它將成為聯(lián)接物理世界和數(shù)字世界的橋梁,依舊會遵循以人為本、回歸用戶場景創(chuàng)造極致體驗的價值準(zhǔn)則。”
大家習(xí)以為常的手機,其實是距離老百姓最近的高科技產(chǎn)品,它匯聚了5G、AI、虛擬現(xiàn)實、芯片、影像、半固態(tài)電池等幾乎所有前瞻性的技術(shù)。當(dāng)前的AI和機器人,分別代表數(shù)字世界和物理世界的頂尖技術(shù)成果,但兩個世界尚處于相對獨立狀態(tài),未能完美聯(lián)接。
歸根結(jié)底,手機和機器人在產(chǎn)業(yè)的定位中有著相似的邏輯——都是在幫人們把數(shù)字世界與物理世界連接起來。而通過技術(shù)復(fù)用(比如影像技術(shù))+場景延伸,掌握數(shù)億用戶、離用戶場景最近的手機廠商能很平滑切入機器人賽道,形成”硬件-數(shù)據(jù)-場景”的正向循環(huán)。
另外,相比于大量靠資本輸血的機器人初創(chuàng)企業(yè),手機廠商不僅有充足的現(xiàn)金流和人才儲備,更關(guān)鍵的是在產(chǎn)業(yè)鏈有足夠的話語權(quán)、有海量的用戶行為數(shù)據(jù)和場景需求,能夠快速將實驗室的技術(shù)轉(zhuǎn)化為商業(yè)成果。
而手機本身又是產(chǎn)業(yè)鏈高度分工的產(chǎn)物,作為頭部的手機廠商都已經(jīng)構(gòu)建了完善且強大的供應(yīng)鏈能力,品牌商做好最核心的用戶體驗和操作系統(tǒng),手機里的元器件交給生態(tài)伙伴。這樣的路徑也將復(fù)制到機器人賽道,vivo的定位是做機器人的“大腦”和“眼睛”,至于手腳、材料等元器件交給供應(yīng)鏈。
在業(yè)內(nèi)看來,機器人產(chǎn)業(yè)最終會像手機一樣,高度分工。而有著海量用戶和技術(shù)積累的手機廠商,將在下一個產(chǎn)業(yè)革命到來時,掌握主動權(quán)。
在眾多手機廠商里,vivo有個鮮明的特征,就是奉行著“埋頭種因”的企業(yè)文化,也成了長期主義的受益者。影像是vivo埋頭種因結(jié)下的最矚目的碩果,前后花了十年時間,讓vivo手機的影像體驗從追趕到領(lǐng)跑。而當(dāng)下,vivo在機器人賽道的布局其實也是為下一個產(chǎn)業(yè)浪潮埋頭種因。