百度谷歌相繼用AI布局的“聽新聞”到底是什么?
“AI主播”真正落地,還有離不開的“三大件”
通過信息流的看聽模式,“AI主播”現(xiàn)在有了更快、更廣泛的落地方式,但要真正讓用戶認可,并不是簡單上線一個功能這么簡單,它還有三個方面的門檻。
1、技術(shù):以自然化的表達拒絕“噱頭”
生硬、冷冰冰的語音播報是之前不少“聽新聞”APP或工具下,用戶的主要感覺,這顯然無法獲得長期認同,只能“圖個新鮮”。
百度、Google等巨頭的加入,改變了這一情況。
實測,在百度APP的看聽模式中,除了朗讀節(jié)奏流暢、與真人說話幾乎無異,用戶還可以基于自己的喜好選擇不同音色,成熟、磁性、深情、活力、可愛……
而這種擬真化,來自于百度打造的世界上第一個能在云端提供大規(guī)模并行WaveRNN等實時語音合成技術(shù)的解決方案,簡單說,即能成句、成片合成音節(jié),而不是像傳統(tǒng)技術(shù)那樣單個音頻點拼湊起來(所以顯得生硬、冷冰冰)。
它的背后,是AI技術(shù)的深度積累和海量數(shù)據(jù)資源優(yōu)勢,通過分析新聞的詞匯、句法、人物和事件等信息,完成高度擬人、流暢自然的語音合成。
2、內(nèi)容:優(yōu)質(zhì)內(nèi)容支撐才能讓AI技術(shù)更有發(fā)揮余地
沒有優(yōu)質(zhì)內(nèi)容支撐的看聽模式是無緣之木。
即便有一天AI語音播報可以實現(xiàn)央視播音員的水平(這并非沒有可能),如果內(nèi)容本身質(zhì)量不佳,所謂“聽新聞”其實還是偽命題。
百度看聽模式,一定只能是其長期內(nèi)容耕耘的結(jié)果,在信息流層面,百度多年來持續(xù)優(yōu)化創(chuàng)作者環(huán)境,尤其是不斷加大力度引入包括人民日報在內(nèi)的優(yōu)質(zhì)內(nèi)容源,已經(jīng)使得百度信息流成為權(quán)威新聞的發(fā)布平臺之一,某種程度上并不輸各種新聞APP。
在這個基礎上進行的看聽模式,就有了深厚的根基。
更進一步看,以信息和知識為主要傳播對象的百度移動生態(tài),“聽新聞”轉(zhuǎn)化到“聽知識”(例如醫(yī)學權(quán)威健康知識的碎片化學習),也不是不可能,過去的積累其實為百度移動生態(tài)埋下了更多商業(yè)可能。
3、認知:“秘書式”服務更能體現(xiàn)“聽”的價值
從產(chǎn)品的角度看,“聽新聞”有點像為用戶定制了一個“秘書”,把有需要的新聞“念”給用戶聽,用戶以一種舒適的心態(tài)完成APP上的新聞資訊獲取。
在這個背景下,百度APP看聽模式的一個亮點功能——朗讀時用戶可以選擇通篇朗讀或者提取資訊中的核心進行播報——就更好理解了。
在用戶選擇后,看聽模式可以對每一篇資訊的要點進行抓取并生成摘要,AI只會將摘要部分朗讀出來,而不會全篇閱讀,這很像“秘書”般的簡報服務。
這種能力,來源于NLP技術(shù)的深耕,使得AI具有某種對新聞的認知能力,會分析文章里的詞匯、句法、人物和事件等信息,自動識別關(guān)鍵部分,最終形成方便閱讀或傾聽的簡訊內(nèi)容讓AI播報出來。
毫無疑問,這將更大程度滿足快節(jié)奏生活的需要,而多樣化的選擇本身也是贏得客戶好感的過程,只不過這種多樣化十分依賴AI技術(shù)來完成,不是只有一個idea就行。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?