阿里達摩院參與制定VCM國際視頻標準,提案斬獲兩項第一
11月18日消息,在國際視頻標準MPEG Technical Requirements工作組關(guān)于MPEG Video Coding for Machine(以下簡稱“MPEG-VCM”)的技術(shù)征集提案評測中,阿里巴巴達摩院聯(lián)合香港城市大學(xué)提交的方案在機器視覺任務(wù)中取得2項第一,是唯一一個斬獲多項第一的提案。據(jù)悉,MPEG于今年上半年向全球發(fā)布MPEG-VCM技術(shù)征集書,10月完成響應(yīng)提案性能的評測,該階段的提案將為后續(xù)標準制定提供重要參考。
視頻編碼是視頻信號存儲和傳輸?shù)幕A(chǔ),它可以在人眼觀看無明顯質(zhì)量下降的情況下將視頻壓縮數(shù)百倍甚至數(shù)千倍,極大地降低視頻傳輸帶寬成本和存儲成本。該領(lǐng)域于上世紀八十年代開始進入標準化發(fā)展,至今面向人眼的視頻編碼標準已經(jīng)歷了多代的迭代和優(yōu)化,目前最新最高效的視頻編碼標準為H.266/VVC標準。
隨著自動駕駛,智慧城市和工業(yè)互聯(lián)網(wǎng)等人工智能場景的發(fā)展,面向機器的視頻編碼需求急劇上升,以機器視覺為主的機器到機器的數(shù)據(jù)傳輸預(yù)計將于2023年占據(jù)全球數(shù)據(jù)傳輸總量的約50%。相比傳統(tǒng)視頻,該類場景具有高觀測精度、高感知靈敏度、高強度工作耐受性等特點,業(yè)界迫切需要全新的視頻編碼技術(shù)。為此,MPEG于2019年7月成立VCM工作組,推進機器視覺視頻編碼標準化工作,并吸引了阿里巴巴、愛立信、諾基亞、浙江大學(xué)及ETRI等國內(nèi)外企業(yè)和機構(gòu)的參與。
提案征集是視頻標準制定的重要階段,本次MPEG-VCM共接收到來自全球16家企業(yè)和機構(gòu)的提案,所有提案在多項機器視覺任務(wù)和多個數(shù)據(jù)集上進行測試。以BD-rate和BD-rate(Pareto)指標衡量各個提案相對于H.266/VVC標準的碼率節(jié)省,最終,達摩院聯(lián)合香港城市大學(xué)的提案(Proposal 02)在物體檢測任務(wù)中取得兩項性能第一。
(圖:達摩院與香港城市大學(xué)的提案獲得兩項第一)
據(jù)介紹,達摩院提出了全新的VCM框架,聯(lián)合自適應(yīng)時空域編碼方案JAST,該方案包括面向機器的預(yù)分析、面向機器的預(yù)處理、自適應(yīng)時域變采樣、自適應(yīng)空域變采樣和核心視頻編碼器五大模塊,最終有效提升面向機器視覺任務(wù)性能的壓縮效率。在標準測試條件的物體檢測任務(wù)中,JAST方案可獲得平均39.04%的性能提升。
達摩院研究員葉琰表示:“隨著超高清視頻、AR/VR、自動駕駛、智慧城市和工業(yè)互聯(lián)網(wǎng)等新應(yīng)用的爆發(fā),視頻編碼技術(shù)既要面向人眼也要面向機器,我們將持續(xù)深度參與國際視頻標準的制定,用創(chuàng)新技術(shù)為各行各業(yè)降低帶寬成本!
過去幾年,達摩院積極參與國際視頻標準的制定,在ITU-T和INCITS等重要國際視頻標準組織中擔(dān)任主席和副主席職位,達摩院自研的Ali266在全球編解碼頂級賽事MSU 2021比賽中獲得了全高清FullHD客觀性能賽道的8項第一和主觀賽道的冠軍。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨角獸:獲上市公司戰(zhàn)投,干人形機器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局