谷歌正在研究能夠讓計算機合成語音更加自然的技術
3月28日,據國外媒體報道,谷歌研究院正在探索讓機器合成語音更加自然的方法。谷歌大腦和機器感知團隊的成員本周二在博客中公布了一些能讓語音更具有表現力的方法示例。
同時,谷歌發(fā)布了“云端文本轉語音”服務的測試版,提供了與谷歌助手同樣的語音合成服務。該服務采用了DeepMind的WaveNet技術,這個技術可以被用于生成非常自然的聲音。
有報道顯示,谷歌研究員近期發(fā)表了兩篇論文,提出了新的發(fā)音方法,介紹了如何模仿語音中的重音或語調。這兩篇論文的技術都是基于Tacotron2。Tacotron2是谷歌去年12月份推出的人工智能系統,使用神經網絡進行訓練,模仿人類語音。
Tacotron在大部分情況下都可以模擬真人聲音,但是卻無法模仿說話中的重音和自然語調。Tacotron的聯合發(fā)明人Wang Yuxuan參與了其中一篇論文研究。研究通過將人類語音片段嵌入計算機語音風格,使合成語音中實現了重音等效果。另一篇論文的研究則使用無監(jiān)督訓練和識別語音模式,并模仿某些語音風格。
在語音技術研發(fā)上,去年蘋果Siri被眾多消費者認為是更加具有表現力的聲音。同時去年四月,亞馬遜Alexa面向語音應用開發(fā)者提供了SSML標簽,在語音助手中增加了更豐富的表達,例如停頓、輕語,以及一些感嘆詞等。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統治的開始
- 2 北電數智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?