谷歌AI黑科技:將同時(shí)說話的兩個(gè)人聲音分離
4月13日消息 近日,谷歌研究博客發(fā)表一篇文章,介紹一項(xiàng)通過人工智能分離視頻中多個(gè)人聲的技術(shù)。這一技術(shù)目前能精確的過濾人聲,只留下被過濾者自己的聲音。谷歌專家團(tuán)隊(duì)通過機(jī)器學(xué)習(xí)結(jié)合面部識(shí)別,達(dá)到準(zhǔn)確的分離人聲的目的。
谷歌同時(shí)上傳了幾個(gè)小視頻,來展現(xiàn)該技術(shù)的應(yīng)用場景。谷歌研究團(tuán)隊(duì)解釋道,他們通過算法追蹤面部動(dòng)作,通過學(xué)習(xí)YouTube上十萬份優(yōu)質(zhì)的講座和演講視頻,利用卷積神經(jīng)網(wǎng)絡(luò)模型將聲音分離出來。
目前,谷歌研究團(tuán)隊(duì)表示,未來或可能應(yīng)用到Hangouts或者Duo這樣的語音電話中,只要你開啟攝像頭,系統(tǒng)就能自動(dòng)將背景雜音過濾掉。其他像是自動(dòng)字幕或者自動(dòng)翻譯未來可能也會(huì)因此受惠。
目前,谷歌已經(jīng)將這一項(xiàng)目托管到GitHub中,感興趣可以點(diǎn)此查看。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長度6~500個(gè)字
最新活動(dòng)更多
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
推薦專題