干貨!一文讀懂AI計(jì)算機(jī)視覺(jué)技術(shù),“視覺(jué)五虎將”值得關(guān)注
作為人工智能的關(guān)鍵領(lǐng)域之一的計(jì)算機(jī)視覺(jué)近期再次成為了熱點(diǎn),那么你真的了解什么是計(jì)算機(jī)視覺(jué)嗎?
一、什么是計(jì)算機(jī)視覺(jué)?
計(jì)算機(jī)視覺(jué),英文Computer Vision,簡(jiǎn)稱CV。計(jì)算機(jī)視覺(jué)是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說(shuō),就是指用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等。
二、計(jì)算機(jī)視覺(jué)和機(jī)器視覺(jué)有何區(qū)別?
事實(shí)上,二者經(jīng)常會(huì)被混淆,甚至有些“專家”也沒(méi)分清。
簡(jiǎn)單的說(shuō),二者最大的區(qū)別,在于技術(shù)要求的側(cè)重點(diǎn)不一樣,甚至差別很大。 計(jì)算機(jī)視覺(jué)(CV),主要是對(duì)質(zhì)的分析,比如分類識(shí)別,這是一個(gè)杯子那是一條狗;蛘咦錾矸荽_認(rèn),比如人臉識(shí)別,車牌識(shí)別;蛘咦鲂袨榉治觯热缛藛T入侵,徘徊,遺留物,人群聚集等。
機(jī)器視覺(jué)(MV),主要側(cè)重對(duì)量的分析,比如通過(guò)視覺(jué)去測(cè)量一個(gè)零件的直徑,一般來(lái)說(shuō),對(duì)準(zhǔn)確度要求很高。
三、計(jì)算機(jī)視覺(jué)主要任務(wù)是什么?
計(jì)算機(jī)視覺(jué)的主要任務(wù)就是通過(guò)對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的信息。計(jì)算機(jī)視覺(jué)任務(wù)的主要類型有以下幾種:
1、物體檢測(cè)
物體檢測(cè)是視覺(jué)感知的第一步,也是計(jì)算機(jī)視覺(jué)的一個(gè)重要分支。物體檢測(cè)的目標(biāo),就是用框去標(biāo)出物體的位置,并給出物體的類別。
物體檢測(cè)和圖像分類不一樣,檢測(cè)側(cè)重于物體的搜索,而且物體檢測(cè)的目標(biāo)必須要有固定的形狀和輪廓。圖像分類可以是任意的目標(biāo),這個(gè)目標(biāo)可能是物體,也可能是一些屬性或者場(chǎng)景。
2、物體識(shí)別(狹義)
計(jì)算機(jī)視覺(jué)的經(jīng)典問(wèn)題便是判定一組圖像數(shù)據(jù)中是否包含某個(gè)特定的物體,圖像特征或運(yùn)動(dòng)狀態(tài)。這一問(wèn)題通?梢酝ㄟ^(guò)機(jī)器自動(dòng)解決,但是到目前為止,還沒(méi)有某個(gè)單一的方法能夠廣泛的對(duì)各種情況進(jìn)行判定:在任意環(huán)境中識(shí)別任意物體。
現(xiàn)有技術(shù)能夠也只能夠很好地解決特定目標(biāo)的識(shí)別,比如簡(jiǎn)單幾何圖形識(shí)別、人臉識(shí)別、印刷或手寫文件識(shí)別,或者車輛識(shí)別。而且這些識(shí)別需要在特定的環(huán)境中,具有指定的光照,背景和目標(biāo)姿態(tài)要求。
3、圖像分類
一張圖像中是否包含某種物體,對(duì)圖像進(jìn)行特征描述是物體分類的主要研究?jī)?nèi)容。一般說(shuō)來(lái),物體分類算法通過(guò)手工特征或者特征學(xué)習(xí)方法對(duì)整個(gè)圖像進(jìn)行全局描述,然后使用分類器判斷是否存在某類物體。
圖像分類問(wèn)題就是給輸入圖像分配標(biāo)簽的任務(wù),這是計(jì)算機(jī)視覺(jué)的核心問(wèn)題之一。這個(gè)過(guò)程往往與機(jī)器學(xué)習(xí)和深度學(xué)習(xí)不可分割。
4、物體定位
如果說(shuō)圖像識(shí)別解決的是what,那么,物體定位解決的則是where的問(wèn)題。利用計(jì)算視覺(jué)技術(shù)找到圖像中某一目標(biāo)物體在圖像中的位置,即定位。
目標(biāo)物體的定位對(duì)于計(jì)算機(jī)視覺(jué)在安防、自動(dòng)駕駛等領(lǐng)域的應(yīng)用有著至關(guān)重要的意義。
5、圖像分割
在圖像處理過(guò)程中,有時(shí)會(huì)需要對(duì)圖像進(jìn)行分割來(lái)提取有價(jià)值的用于后繼處理的部分,例如篩選特征點(diǎn),或者分割一或多幅圖片中含有特定目標(biāo)的部分等。
圖像分割指的是將數(shù)字圖像細(xì)分為多個(gè)圖像子區(qū)域(像素的集合,也被稱作超像素)的過(guò)程。圖像分割的目的是簡(jiǎn)化或改變圖像的表示形式,使得圖像更容易理解和分析。更精確地說(shuō),圖像分割是對(duì)圖像中的每個(gè)像素加標(biāo)簽的一個(gè)過(guò)程,這一過(guò)程使得具有相同標(biāo)簽的像素具有某種共同視覺(jué)特性。
“圖像語(yǔ)意分割”是一個(gè)像素級(jí)別的物體識(shí)別,即每個(gè)像素點(diǎn)都要判斷它的類別。它和檢測(cè)的區(qū)別是,物體檢測(cè)是一個(gè)物體級(jí)別的,他只需要一個(gè)框,去框住物體的位置,而通常分割是比檢測(cè)要更難的問(wèn)題。
計(jì)算機(jī)視覺(jué)是通過(guò)創(chuàng)建人工模型來(lái)模擬本由人類執(zhí)行的視覺(jué)任務(wù)。其本質(zhì)是模擬人類的感知與觀察的一個(gè)過(guò)程。這個(gè)過(guò)程不止識(shí)別,而是包含了一系列的過(guò)程,并且最終是可以在人工系統(tǒng)中被理解和實(shí)現(xiàn)的。
四、“視覺(jué)五虎將”都是誰(shuí)?
目前在計(jì)算機(jī)視覺(jué)領(lǐng)域已經(jīng)涌現(xiàn)出商湯科技、曠視科技、深蘭科技、依圖科技、云從科技等一批技術(shù)領(lǐng)先的獨(dú)角獸公司,行業(yè)稱為“視覺(jué)五虎將”,我們對(duì)這些公司作個(gè)簡(jiǎn)單介紹。
商湯科技:
公開(kāi)資料顯示,商湯科技成立于2014年11月,是中國(guó)一家計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)原創(chuàng)技術(shù)的創(chuàng)新型科技公司,也是一家知名獨(dú)角獸企業(yè),致力于引領(lǐng)人工智能核心“深度學(xué)習(xí)”的技術(shù)突破,構(gòu)建人工智能、大數(shù)據(jù)分析行業(yè)解決方案。
目前,商湯科技已與眾多知名戰(zhàn)略合作伙伴和大客戶建立合作,賦能AI于多個(gè)行業(yè),迅速落地包括人臉識(shí)別、圖像識(shí)別、視頻分析、無(wú)人駕駛、醫(yī)療影像識(shí)別等各類應(yīng)用技術(shù)。此外,商湯科技以人工智能技術(shù)服務(wù)于各大安防監(jiān)控公司、銀行金融機(jī)構(gòu)、手機(jī)廠商、機(jī)器人廠商、多家移動(dòng)APP廠商以及政府公安等客戶。
深蘭科技:
深蘭科技,2014年由歸國(guó)博士團(tuán)隊(duì)創(chuàng)建,在全球擁有近百位全職博士和博士后學(xué)術(shù)帶頭人,幾百位名校碩士研發(fā)人員,創(chuàng)造性地發(fā)明了數(shù)十項(xiàng)原創(chuàng)算法和原創(chuàng)技術(shù),團(tuán)隊(duì)曾多次獲得多項(xiàng)世界大賽和國(guó)內(nèi)大賽的第一名。致力于人工智能基礎(chǔ)研究和應(yīng)用開(kāi)發(fā)。團(tuán)隊(duì)利用自主知識(shí)產(chǎn)權(quán)的深度學(xué)習(xí)架構(gòu)、機(jī)器視覺(jué)、生物智能識(shí)別等人工智能算法、無(wú)媒介支付等核心技術(shù),在自動(dòng)駕駛及整車制造、智能機(jī)器人、生物智能、AI芯片、智能零售、智慧城市、智慧安防、教育軍工等領(lǐng)域都有深入布局,居行業(yè)領(lǐng)導(dǎo)地位。
目前,在歐洲、美國(guó)、澳洲等多地設(shè)立區(qū)域總部和分支研發(fā)機(jī)構(gòu),國(guó)際銷售網(wǎng)絡(luò)覆蓋全球17個(gè)國(guó)家。擁有包括英特爾在內(nèi)的6家世界級(jí)人工智能企業(yè)建立了人工智能、AIoT智聯(lián)網(wǎng)、人機(jī)交互、AI芯片等相關(guān)的領(lǐng)域的聯(lián)合實(shí)驗(yàn)室,共同構(gòu)筑了全球性的研發(fā)科研體系,2017年利用機(jī)器視覺(jué)等技術(shù)研發(fā)了市場(chǎng)公認(rèn)的超越Amazon go的takego人工智能無(wú)人店技術(shù),2018年發(fā)布了全球第一款自動(dòng)駕駛功能性商用車。
曠視科技:
曠視科技成立于2011年10月,以深度學(xué)習(xí)和物聯(lián)傳感技術(shù)為核心,立足于自有原創(chuàng)深度學(xué)習(xí)算法引擎Brain++,深耕金融安全,城市安防,手機(jī)AR,商業(yè)物聯(lián),工業(yè)機(jī)器人五大核心行業(yè)。發(fā)展至今,曠視已在北京、西雅圖、南京設(shè)立獨(dú)立研究院,并在十余個(gè)核心城市設(shè)立分部。
曠視的核心人臉識(shí)別技術(shù)Face++曾被美國(guó)著名科技評(píng)論雜志《麻省理工科技評(píng)論》評(píng)定為2017全球十大前沿科技,同時(shí)公司入榜全球最聰明公司并位列第11名。在中國(guó)科技部火炬中心“獨(dú)角獸”榜單中,曠視排在人工智能類首位。
依圖科技:
成立于2012年,公司核心業(yè)務(wù)包括智能安防平臺(tái)、智慧健康醫(yī)療、城市數(shù)據(jù)大腦、智能硬件設(shè)備等。目前,依圖的技術(shù)早已經(jīng)服務(wù)全國(guó)20余省安防,為海關(guān)總署及中國(guó)邊檢等提供人像比對(duì)系統(tǒng),并在招商銀行、浦發(fā)銀行,遺跡互聯(lián)網(wǎng)金融等多個(gè)業(yè)務(wù)場(chǎng)景中廣泛應(yīng)用,車輛識(shí)別產(chǎn)品亦被公安系統(tǒng)廣泛采用,依圖也是目前國(guó)內(nèi)唯一擁有10億級(jí)人像庫(kù)比對(duì)能力的公司,搭建了全球最大的人像系統(tǒng),覆蓋超過(guò)15億人像。
云從科技:
成立于2015年4月,是一家從中科院重慶研究院孵化的專注于計(jì)算機(jī)視覺(jué)與人工智能的高科技企業(yè)。是計(jì)算機(jī)視覺(jué)頭部企業(yè)中的國(guó)家隊(duì),承建了國(guó)家發(fā)改委的基礎(chǔ)項(xiàng)目重大工程——“人工智能基礎(chǔ)資源公共服務(wù)平臺(tái)”與產(chǎn)業(yè)化項(xiàng)目重大工程“人臉識(shí)別系統(tǒng)產(chǎn)業(yè)化應(yīng)用平臺(tái)”。與公安部、四大銀行、證通、民航總局建立聯(lián)合實(shí)驗(yàn)室,推動(dòng)人工智能產(chǎn)品標(biāo)準(zhǔn)的建立,成為唯一同時(shí)制定國(guó)標(biāo)、部標(biāo)、行標(biāo)的人工智能企業(yè)。國(guó)家發(fā)改委公布的《2017年“互聯(lián)網(wǎng)+”重大工程擬支持項(xiàng)目名單》中包含四個(gè)AI公司,云從科技是其中唯一一家創(chuàng)業(yè)公司。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單
- 10 一文看懂視覺(jué)語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用