商湯科技AI+3D能否成為AI行業(yè)變革新引擎?
AI+3D,一項(xiàng)具有革命性改變的感知技術(shù),正在慢慢向工業(yè)生產(chǎn)、硬件制造,以及人們?nèi)粘I顫B入。
3D感知硬件能夠提供距離、深度等數(shù)據(jù)信息,但這并不是單純的數(shù)據(jù),而是基于這些數(shù)據(jù),通過不同的表達(dá)和理解方式,實(shí)現(xiàn)不同的應(yīng)用。比如對(duì)三維場(chǎng)景進(jìn)行數(shù)字化建模,或者繪制三維地圖,從而讓機(jī)器能夠?qū)崟r(shí)感知自己在所處空間中的位置,以便在運(yùn)動(dòng)時(shí)及時(shí)避開障礙物等。
這需要根據(jù)深度信息生成深度圖像,并與RGB圖像,甚至是紅外圖像進(jìn)行融合并完成大量計(jì)算。
而商湯科技向筆者表示,通過硬件感知信息生成的深度圖像,往往存在因硬件性能限制而產(chǎn)生瑕的疵。例如在細(xì)小或復(fù)雜交錯(cuò)的物體之間,出現(xiàn)深度信息估計(jì)錯(cuò)誤等問題。此外,精準(zhǔn)度、魯棒性、實(shí)時(shí)性、效率等都是決定實(shí)際應(yīng)用效果的關(guān)鍵。這些問題和應(yīng)用效果都需要依靠額外的算法進(jìn)行實(shí)時(shí)處理予以彌補(bǔ)和增強(qiáng)。
據(jù)悉,AI可通過對(duì)大量實(shí)際數(shù)據(jù)進(jìn)行學(xué)習(xí),自行總結(jié)其中的規(guī)律和特征。這種方法可以在短時(shí)間內(nèi),完成傳統(tǒng)算法需要多年才能突破的問題,有效彌補(bǔ)硬件能力的不足。
3D硬件小型化,是3D視覺技術(shù)應(yīng)用場(chǎng)景拓展和創(chuàng)新的硬件基礎(chǔ),而AI技術(shù)則是真正的動(dòng)力引擎,兩者密不可分。在商湯科技看來,AI+3D視覺技術(shù)拐點(diǎn)已至。
什么是AI+3D?
初次接觸,可能很多人,對(duì)于AI+3D這項(xiàng)技術(shù)有些陌生。但實(shí)際上,了解之后便會(huì)發(fā)現(xiàn),就如前文所說“AI+3D是一項(xiàng)最新的感知技術(shù)”。3D屬于成像技術(shù),是靠人兩眼的視覺差產(chǎn)生的。基于攝像頭獲取的圖像信息,視覺技術(shù)可以搭配AI技術(shù)解決各種實(shí)際應(yīng)用問題。
這些深度圖像信息則可以豐富AI圖像視覺技術(shù),如同人眼一樣對(duì)場(chǎng)景深度進(jìn)行感知。商湯科技向筆者稱:“對(duì)于AI來說,能像人類一樣獲得深度信息后的感知能力,是他們研究這項(xiàng)課題的想法。行業(yè)早些年研究結(jié)構(gòu)光、ToF、雙攝等基于硬件設(shè)備技術(shù)都是為了帶來深度信息,搭配AI對(duì)3D圖像的感知能力,豐富不同領(lǐng)域的應(yīng)用”。
同時(shí),光鑒科技首席執(zhí)行官朱力認(rèn)為:“3D視覺技術(shù)的意義,是打開了更加廣闊的AI應(yīng)用空間。無論是輔助駕駛,還是各種虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用,這些前沿概念的落地都建立在信息交互基礎(chǔ)上。對(duì)正處于發(fā)展中的AI產(chǎn)業(yè)來說,3D視覺將幫助機(jī)器更好地“看”世界”。
據(jù)筆者了解,隨著硬件設(shè)備的小型化,AI+3D技術(shù)及其成熟的解決方案,可在手機(jī)應(yīng)用、人臉識(shí)別、AR/VR領(lǐng)域、汽車、工業(yè)等具有相關(guān)性領(lǐng)域進(jìn)行研發(fā)和場(chǎng)景落地。
例如:通用3D重建技術(shù),從毛絨玩具、紙箱、書包、鞋子到雕塑,用戶只需拿手機(jī)沿著物體360度環(huán)繞掃描,就能將其掃描成數(shù)字化的模型。生成的模型文件可直接用于3D打印、3D/AR相冊(cè)預(yù)覽,也可應(yīng)用于生成短視頻直播的內(nèi)容并設(shè)置動(dòng)畫,也可植入到AR養(yǎng)寵等游戲、電商的商品展示或預(yù)覽等場(chǎng)景中。
除此,在汽車領(lǐng)域,AI+3D技術(shù)能夠?qū)崿F(xiàn)更加精準(zhǔn)的人、車、物識(shí)別和距離感知,從而有力推動(dòng)自動(dòng)駕駛發(fā)展。在工業(yè)領(lǐng)域,AI+3D將進(jìn)一步優(yōu)化工業(yè)生產(chǎn)流程,可為機(jī)械臂賦予3D感知能力,通過高精準(zhǔn)的SLAM、物體重建和測(cè)量等技術(shù),判斷立體物體所處的位置,以及相應(yīng)尺寸、形狀和質(zhì)量等信息,提升工業(yè)生產(chǎn)智能化能力。
目前,商湯科技已在人臉識(shí)別、汽車、工業(yè)、電商、手機(jī)等領(lǐng)域進(jìn)行了深入研究。
AI+3D能否成為AI業(yè)又一“強(qiáng)心劑”
人工智能作為第四次工業(yè)革命的產(chǎn)物之一,給社會(huì)、工業(yè)、人帶來的是一場(chǎng)人機(jī)交互變革。與此同時(shí)在該產(chǎn)業(yè)也誕生了許多新興企業(yè),如:商湯科技、寒武紀(jì)、曠視科技、云從科技、同盾科技等估值達(dá)到或超過10億美元的AI企業(yè)。
按照產(chǎn)業(yè)鏈,從底層硬件到上層的應(yīng)用,整個(gè)AI+3D產(chǎn)業(yè)鏈可以分為四類廠商,在國(guó)內(nèi)外均有企業(yè)在進(jìn)行相應(yīng)的開發(fā):一、3D感知硬件設(shè)備的相關(guān)供應(yīng)商,包括鏡頭、攝像頭模組、圖像傳感器,以及紅外光源等器件;二、基于3D感知的AI技術(shù)/算法提供商;三、手機(jī)廠商,將AI+3D軟硬件技術(shù)進(jìn)行整合;四、應(yīng)用開發(fā)商,開發(fā)基于AI+3D技術(shù)的應(yīng)用。
很多AI企業(yè)則屬于第二類:基于3D感知的AI技術(shù)/算法提供商。
而本次AI+3D技術(shù)的應(yīng)用和產(chǎn)業(yè)鏈延伸更是將AI行業(yè)發(fā)展推向高潮。國(guó)外調(diào)研機(jī)構(gòu)QYResearch曾預(yù)測(cè),全球3D技術(shù)市場(chǎng)規(guī)模2012年為796億美元,至2022年將達(dá)到3892億美元,年復(fù)合增長(zhǎng)率為17.20%。
商湯科技認(rèn)為,“ToF在智能手機(jī)上的加速應(yīng)用,有助于3D視覺技術(shù)的廣泛普及化,會(huì)成為接下來10年中非常重要的科技趨勢(shì)。業(yè)內(nèi)統(tǒng)計(jì),2019年TOF新機(jī)出貨約0.5億臺(tái),預(yù)估2020年將達(dá)到1.5億臺(tái)”。
在筆者看來,AI+3D技術(shù)所產(chǎn)生的價(jià)值則是對(duì)以往機(jī)器2D視覺認(rèn)知的更新迭代或替代,可以讓機(jī)器通過視覺三維影像,更加智能化,對(duì)所處世界有一個(gè)較為全面且深刻的信息感知與理解。從人機(jī)交互、互動(dòng)娛樂、內(nèi)容創(chuàng)作、身份驗(yàn)證、拍照、電商等層面激發(fā)大量的創(chuàng)新應(yīng)用場(chǎng)景。改變傳統(tǒng)商業(yè)運(yùn)作模式。
不過,目前除了商湯科技外,谷歌、微軟、曠視科技在AI+3D技術(shù)方面也有研究。據(jù)曠視科技云事業(yè)部高級(jí)副總裁吳文昊介紹稱,“該技術(shù)已在手機(jī)領(lǐng)域有多種案例出來,但包含算法和模組的整體解決方案仍是缺位,公司正在嘗試一種從上往下的整合方案,從3D應(yīng)用層往下依次至AI算法、解決方案,最后到攝像、傳感等硬件設(shè)備制造上”。
另有行業(yè)人士認(rèn)為:“AI技術(shù)可以讓3D打印實(shí)現(xiàn)以機(jī)器制造機(jī)器人,這也是新一輪制造業(yè)革命的助推劑”。
作者:珍珍

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
-
10 月之暗面,絕地反擊
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?