谷歌正在研究能夠讓計算機(jī)合成語音更加自然的技術(shù)
3月28日,據(jù)國外媒體報道,谷歌研究院正在探索讓機(jī)器合成語音更加自然的方法。谷歌大腦和機(jī)器感知團(tuán)隊的成員本周二在博客中公布了一些能讓語音更具有表現(xiàn)力的方法示例。
同時,谷歌發(fā)布了“云端文本轉(zhuǎn)語音”服務(wù)的測試版,提供了與谷歌助手同樣的語音合成服務(wù)。該服務(wù)采用了DeepMind的WaveNet技術(shù),這個技術(shù)可以被用于生成非常自然的聲音。
有報道顯示,谷歌研究員近期發(fā)表了兩篇論文,提出了新的發(fā)音方法,介紹了如何模仿語音中的重音或語調(diào)。這兩篇論文的技術(shù)都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系統(tǒng),使用神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,模仿人類語音。
Tacotron在大部分情況下都可以模擬真人聲音,但是卻無法模仿說話中的重音和自然語調(diào)。Tacotron的聯(lián)合發(fā)明人Wang Yuxuan參與了其中一篇論文研究。研究通過將人類語音片段嵌入計算機(jī)語音風(fēng)格,使合成語音中實現(xiàn)了重音等效果。另一篇論文的研究則使用無監(jiān)督訓(xùn)練和識別語音模式,并模仿某些語音風(fēng)格。
在語音技術(shù)研發(fā)上,去年蘋果Siri被眾多消費(fèi)者認(rèn)為是更加具有表現(xiàn)力的聲音。同時去年四月,亞馬遜Alexa面向語音應(yīng)用開發(fā)者提供了SSML標(biāo)簽,在語音助手中增加了更豐富的表達(dá),例如停頓、輕語,以及一些感嘆詞等。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局