AI虛擬主播“小靈”背后有哪些秘密?
今年“五四運(yùn)動(dòng)”迎來(lái)一百年的生日,在中央廣播電視總臺(tái)主題為“我們都是追夢(mèng)人”的 2019《五月的鮮花》五四晚會(huì)上為其獻(xiàn)上一份“新鮮”大禮,百度大腦AI虛擬主持人小靈首次亮相。作為“新新”青年的代表,小靈在舞臺(tái)上賺足了眼球,既能通過(guò)人臉識(shí)別技術(shù)與嘉賓互動(dòng),又有極強(qiáng)地控場(chǎng)能力。
小靈作為3D立體虛擬主持人,糅合了百度大腦的語(yǔ)音、視覺、大數(shù)據(jù),以及AR等多重技術(shù),其中最引人注目的是“唇動(dòng)技術(shù)”。小靈的唇動(dòng)技術(shù),基于大量的面部特征數(shù)據(jù)學(xué)習(xí),輔之以人工智能和深度學(xué)習(xí)技術(shù)而形成的。小靈優(yōu)秀的主持功力背后,究竟有哪些技術(shù)作為支撐呢?虛擬主持人將會(huì)有多大的發(fā)展前景呢?接下來(lái)我們細(xì)細(xì)剖析!
“小靈”臺(tái)上一分鐘,AI幕后做了哪些“十年功”?
小靈在從漫天飛舞的鮮花中走出來(lái),站在主持人小尼和王俊凱中間熱情地與觀眾互動(dòng),活動(dòng)過(guò)程中能夠發(fā)表自己的觀點(diǎn),看似簡(jiǎn)單的行為,背后少不了海量的數(shù)據(jù)支持和超強(qiáng)的人工智能技術(shù)運(yùn)用。
首先,不得不提小靈的“唇動(dòng)技術(shù)”。人說(shuō)話嘴唇會(huì)自然而然地跟著運(yùn)動(dòng),我們習(xí)以為常的事情對(duì)于AI虛擬主持人便沒有那么簡(jiǎn)單了。小靈想要達(dá)到能夠在說(shuō)話的時(shí)候像人一樣自如地開合嘴唇,她一定要做好充足的準(zhǔn)備。第一項(xiàng)準(zhǔn)備事宜便是面部數(shù)據(jù)的搜集,每一項(xiàng)人工智能技術(shù)的產(chǎn)生都需要大量的數(shù)據(jù)作為基石;趯(duì)海量的面部數(shù)據(jù)進(jìn)行深度學(xué)習(xí)加之語(yǔ)音合成技術(shù),便形成了我們看到的人工智能虛擬主持人“小靈”在晚會(huì)上能夠“真實(shí)唇動(dòng)”。
其次,人臉識(shí)別技術(shù)更是現(xiàn)場(chǎng)最大的亮點(diǎn)。在與主持人小尼互動(dòng)的時(shí)候,小尼想借用00后愛看的動(dòng)畫片來(lái)掩蓋自己的真實(shí)年齡時(shí),小靈并沒有“上當(dāng)”。小靈通過(guò)人臉識(shí)別技術(shù)采集了小尼的人臉信息,并利用知識(shí)圖譜清楚地知道小尼的年齡。在小尼企圖用《喜羊羊與灰太狼》來(lái)欺騙小靈時(shí),小靈迅速運(yùn)用自己的“超級(jí)大腦”知識(shí)圖譜來(lái)反駁他說(shuō),《黑貓警長(zhǎng)》、《葫蘆兄弟》才真正屬于他的年代。人臉識(shí)別+知識(shí)圖譜的技術(shù)讓小靈能夠在現(xiàn)場(chǎng)做到隨機(jī)應(yīng)變,與此同時(shí)人臉識(shí)別技術(shù)還運(yùn)用到了與嘉賓互動(dòng)的環(huán)節(jié)。今年晚會(huì)上有一個(gè)有趣的測(cè)“花”活動(dòng),小靈通過(guò)人臉識(shí)別技術(shù)便可測(cè)出你是什么“花”。
除了人臉識(shí)別技術(shù),還有AR、大數(shù)據(jù)、語(yǔ)音識(shí)別等技術(shù)運(yùn)用在小靈身上。“臺(tái)上一分鐘,臺(tái)下十年功”,小靈雖然第一次登臺(tái),卻能夠落落大方、對(duì)答如流離不開各類AI技術(shù)的成熟與靈活配合。
AI虛擬主持人究竟能走多遠(yuǎn)?
其實(shí),小靈并不是首位AI人工智能主持人,在今年兩會(huì)期間搜狗與新華社聯(lián)合推出的“新小萌”和科大訊飛推出了“小晴”兩位人工智能虛擬主持人。兩會(huì)期間推出的兩款均可以找到原型,如新華社推出的“新小萌”是以新華社主播曲萌為原型。這類虛擬主持人通常是真人輸入語(yǔ)音,隨后對(duì)聲音進(jìn)行標(biāo)注和機(jī)器進(jìn)行深度學(xué)習(xí),以此構(gòu)建出其發(fā)音聲學(xué)模型,在此基礎(chǔ)上,輸入任何文本便可進(jìn)行語(yǔ)音合成,進(jìn)而實(shí)現(xiàn)在線播報(bào)。本次五四晚會(huì)亮相的“小靈”是以二次元形象示眾,沒有明確的原型可以尋覓。與此同時(shí)小靈需要在舞臺(tái)上與其他主持人和嘉賓互動(dòng),和在線播報(bào)相比,小靈不僅要運(yùn)用到語(yǔ)音識(shí)別的技術(shù)還要具備能夠在短時(shí)間內(nèi)進(jìn)行大數(shù)據(jù)運(yùn)算的能力。對(duì)于虛擬主持人來(lái)說(shuō),技術(shù)發(fā)展有了進(jìn)一步的提升,但很多人依舊存在疑惑,虛擬主播要來(lái)?yè)尅安ヒ魡T”的飯碗嗎?
人工智能作為一項(xiàng)通用技術(shù),可以為了各行各業(yè)出現(xiàn)的問(wèn)題提供解決辦法,對(duì)于主持人行業(yè)來(lái)說(shuō)也不例外。首先,虛擬主播可以節(jié)省大量人力成本?拼笥嶏w推出的“小晴”精通多種語(yǔ)言,可以在中文、日語(yǔ)、英語(yǔ)、韓語(yǔ)等多種語(yǔ)言中隨意切換,并且發(fā)音準(zhǔn)確,十分專業(yè)。如何能夠?qū)⒃擁?xiàng)技術(shù)可以廣泛普及,在對(duì)外宣傳的節(jié)目中,專業(yè)、標(biāo)準(zhǔn)的發(fā)音能夠極大地提高傳播效果。此外,虛擬主播能夠在惡劣的環(huán)境中完成播報(bào)。眾所周知在各大事件發(fā)生時(shí),記者總是要沖在第一線,掌握最新信息播報(bào)給大眾,但優(yōu)勢(shì)環(huán)境過(guò)于惡劣或者人力難以到達(dá)的時(shí)候,虛擬主播或許能夠派上用場(chǎng)。在戰(zhàn)火紛飛的戰(zhàn)場(chǎng)通過(guò)無(wú)人機(jī)獲取最新情況后,虛擬主播可以實(shí)時(shí)播報(bào)新聞;地震、洪水等自然災(zāi)害發(fā)生后,記者難以最先達(dá)到事故發(fā)生區(qū),虛擬主播便有了用武之地。
虛擬主播隨著人工智能技術(shù)的不斷發(fā)展,可以不斷解決行業(yè)內(nèi)存在的問(wèn)題。至于虛擬主播究竟能不能取代人類的擔(dān)憂,依舊是“杞人憂天”。人工智能技術(shù)是讓人類可以從繁雜、無(wú)聊的工作中解脫出來(lái),而不是取代人類,真正有創(chuàng)造性的工作依舊需要人類自己完成。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用
- 5 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 6 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過(guò)于簡(jiǎn)單