www.日韩在线,久久久久久午夜精品,久久国产v一级毛多内射孕妇

計(jì)算機(jī)視覺邁進(jìn)新征程 “玩家”找出哪些新玩法？

2019-08-06 09:18

當(dāng)前，計(jì)算機(jī)視覺的已經(jīng)成為了一個(gè)跨學(xué)科的領(lǐng)域，計(jì)算機(jī)視覺源于1980年左右的神經(jīng)網(wǎng)絡(luò)技術(shù)，但是直到近幾年才真正實(shí)現(xiàn)了大規(guī)模商業(yè)化落地。大規(guī)模的資金進(jìn)入，促使更多專注于計(jì)算機(jī)視覺的企業(yè)不斷出現(xiàn)，這些企業(yè)在不同的領(lǐng)域通過計(jì)算機(jī)視覺技術(shù)不斷的改造升級(jí)著原有的商業(yè)模式。作為一個(gè)靈感來自人類視覺大腦皮層的技術(shù)，我們現(xiàn)在是否已經(jīng)處在機(jī)器物體探測(cè)或分類能力與人類視覺相當(dāng)，甚至更強(qiáng)的階段了呢？

曠視科技：AI鼻紋識(shí)別

計(jì)算機(jī)視覺邁進(jìn)新征程 “玩家”找出哪些新玩法？

近期，曠視科技推出AI鼻紋識(shí)別解決方案，這項(xiàng)解決方案最先應(yīng)用于犬只身份認(rèn)證。專用于寵物識(shí)別。有別于瞳孔、臉型等其他犬只認(rèn)證方式，曠視選擇鼻紋作為識(shí)別的關(guān)鍵特征。與人類指紋類似，犬類鼻紋具有唯一性與穩(wěn)定不變性，即不存在鼻紋完全相同的兩只犬、同一只犬的鼻紋亦不會(huì)隨著成長(zhǎng)而改變。主人只需對(duì)準(zhǔn)犬鼻進(jìn)行簡(jiǎn)單的抓拍或者視頻錄像，系統(tǒng)通過犬鼻檢測(cè)，定位出鼻紋關(guān)鍵點(diǎn)，將提取到的鼻紋深度圖信息匯入后臺(tái)數(shù)據(jù)庫(kù)，更可為犬只生成一張專屬的身份證。目前，曠視鼻紋識(shí)別技術(shù)能達(dá)到犬只的1：1比對(duì)，在誤識(shí)率為萬分之一的情況下，試點(diǎn)場(chǎng)景中準(zhǔn)確率95％；

極鏈科技：視頻識(shí)別

計(jì)算機(jī)視覺邁進(jìn)新征程 “玩家”找出哪些新玩法？

目前視頻人臉識(shí)別還有很多的困難與挑戰(zhàn)，如視頻圖像質(zhì)量差、人臉圖像小燈問題，極鏈科技提出了以四模塊對(duì)場(chǎng)景中的人臉進(jìn)行識(shí)別。

1．視頻結(jié)構(gòu)化，將視頻用鏡頭分割。通常采用全局特征和局部特征相結(jié)合的方法。全局特征檢測(cè)全局顏色的分布突變，然后借用局部特征獲得的人臉識(shí)別的跟蹤結(jié)果、跟蹤軌跡的斷續(xù)來判斷視頻是否具有鏡頭切換。跟蹤來判斷鏡頭切換有一個(gè)很大的優(yōu)點(diǎn)，因?yàn)楹罄m(xù)的步驟也會(huì)采用相似的算法，所以這一步驟所需的算法是可以重復(fù)使用的。

2．人臉軌跡提取。完成了鏡頭分割以后，就可以分割好的單一鏡頭里進(jìn)行人臉軌跡提取。在軌跡提取的算法上，同樣要考慮準(zhǔn)確率和速度的指標(biāo)。要實(shí)現(xiàn)速度和準(zhǔn)確率的平衡，可以有以下兩種途徑：一是間隔采樣or逐幀處理，二是檢測(cè)＆跟蹤的配合。

3．人臉識(shí)別。有了人臉軌跡之后，就可以開始進(jìn)行人臉的識(shí)別了。但是在將人臉數(shù)據(jù)輸入深度網(wǎng)絡(luò)之前，還需要對(duì)其進(jìn)行必要的變換和處理。其中一部分變換在針對(duì)人臉這一部分非常重要，尤其是在消費(fèi)級(jí)視頻里，那就是人臉的對(duì)齊。人臉對(duì)齊是利用人臉的特征點(diǎn)檢測(cè)定位，將各種姿勢(shì)的人臉圖像還原矯正為正臉的過程。在算法框架中，需要加入人臉質(zhì)量評(píng)估的算法，以過濾低質(zhì)量的人臉圖片，保證人臉數(shù)據(jù)的準(zhǔn)確率。在樣本足夠的前提下，可以利用訓(xùn)練得到的模型對(duì)人臉樣本進(jìn)行特征提取。測(cè)試的時(shí)候，在視頻中檢測(cè)得的人臉后，將其輸入到生成的特征向量里，與人臉互動(dòng)的特征向量進(jìn)行匹配，從而找到在特征空間中最接近的一個(gè)樣本。

4．識(shí)別結(jié)果融合。以上提到的人臉識(shí)別都是針對(duì)單幀識(shí)別的圖片而言的，之前說到的系統(tǒng)識(shí)別結(jié)果都是針對(duì)整個(gè)人臉軌跡而言。因此，最后需要將人臉識(shí)別的結(jié)果與整條人臉軌跡融合起來，得到整個(gè)軌跡的識(shí)別結(jié)果。

商湯科技：面部圖片處理

計(jì)算機(jī)視覺邁進(jìn)新征程 “玩家”找出哪些新玩法？

近日，來自商湯科技，香港中文大學(xué)以及香港大學(xué)的研究團(tuán)隊(duì)提出了一種稱為MaskGAN的新型框架，可實(shí)現(xiàn)多樣化和交互式的面部操作。其主要觀點(diǎn)是語義掩模作為靈活的面部操作的適當(dāng)中間表示，使其具有保真度。MaskGAN有兩個(gè)主要組成部分：

1．密集映射

2．編輯行為模擬訓(xùn)練

具體而言，密集映射網(wǎng)絡(luò)學(xué)習(xí)自由形式的用戶修改掩碼和目標(biāo)圖像之間的樣式映射，從而實(shí)現(xiàn)不同的生成結(jié)果。

以色列魏茨曼科學(xué)研究院：圖像分離

本月，以色列魏茨曼科學(xué)研究所的研究人員開發(fā)出了一項(xiàng)名為Double－DIP的新技術(shù)，該技術(shù)能讓系統(tǒng)在沒有大量訓(xùn)練數(shù)據(jù)的情況下，通過深度學(xué)習(xí)來對(duì)圖像進(jìn)行編輯，分離人們?cè)趫D片中想要的和不想要的部分。該研究基于一項(xiàng)名為DIP（Deep Image Prior）的混合圖像恢復(fù)技術(shù)，因此研究人員將他們開發(fā)的新分離圖像方法稱為Double－DIP。DIP技術(shù)的研究成果已于美國(guó)時(shí)間2018年7月18日提交在arxiv上，名為《圖像恢復(fù)的混合稀疏先驗(yàn)學(xué)習(xí)：深度學(xué)習(xí)與稀疏編碼的結(jié)合（Learning Hybrid Sparsity Prior for Image Restoration： Where Deep Learning Meets Sparse Coding）》。

呂貝克大學(xué)：醫(yī)學(xué)圖像生成新方法

當(dāng)前，GAN應(yīng)用于醫(yī)學(xué)研究還面臨一項(xiàng)重大挑戰(zhàn)。深度學(xué)習(xí)算法需要對(duì)高分辨率圖像進(jìn)行訓(xùn)練，才能產(chǎn)生最佳預(yù)測(cè)，然而合成這樣的高分辨率圖像，尤其是3D圖像，需要大量的計(jì)算能力。來自呂貝克大學(xué)醫(yī)學(xué)信息學(xué)研究所的研究人員提出了一種新方法，可以大大降低硬件的配置要求。研究人員把圖像生成的過程分解為幾個(gè)階段：首先利用GAN生成低分辨率圖像，然后在正確的分辨率下每次生成一小部分的細(xì)節(jié)圖像。通過實(shí)驗(yàn)，研究人員發(fā)現(xiàn)這種方法不僅生成了逼真的高分辨率2D和3D圖像，而且無論圖像大小，支出費(fèi)用都保持不變。

小結(jié)：

在深度學(xué)習(xí)技術(shù)出現(xiàn)之前，很多應(yīng)用都遇到了瓶頸，進(jìn)步很慢，每年只有大概的精確性提升。但隨著深度學(xué)習(xí)的進(jìn)步，計(jì)算機(jī)視覺的發(fā)展經(jīng)歷了一個(gè)巨大的飛躍，技術(shù)的不斷升級(jí)也催生出了一系列跨行業(yè)的應(yīng)用。隨著主流的科技巨頭入場(chǎng)，計(jì)算機(jī)視覺領(lǐng)域已經(jīng)熱鬧非凡，但如果想要開創(chuàng)出一些新的應(yīng)用獲獎(jiǎng)應(yīng)用能力再進(jìn)行提升，恐怕還有不短的路需要走。