語(yǔ)音定制功能實(shí)測(cè):AI讓我們更“離不開(kāi)”百度地圖
你可能已經(jīng)習(xí)慣了“前方路口左轉(zhuǎn)”這樣的地圖語(yǔ)音由一個(gè)標(biāo)準(zhǔn)的女聲,或者某明星的聲音發(fā)出。
但是,百度地圖最近推出的一個(gè)功能“語(yǔ)音定制”可能要顛覆你的認(rèn)知了:指揮路癡的你怎么走,或者與你進(jìn)行日常交互,或者告訴你景點(diǎn)信息、好吃好玩的聲音,可能是你自己的或者是你想要的某種聲音!
過(guò)去幾年,百度地圖陸續(xù)推出以AI為依托的殺手級(jí)應(yīng)用功能,例如能夠識(shí)別復(fù)雜語(yǔ)音需求的“全語(yǔ)音操控”,用戶只需要隨心所欲用嘴說(shuō)出自己要去哪、干什么,地圖就能夠自動(dòng)甄選目的地并導(dǎo)航。
現(xiàn)在,每個(gè)人都可以有屬于自己的地圖定制化語(yǔ)音包,AI再一次讓百度地圖驚艷。而作為行業(yè)觀察者,響鈴和身邊的同事、家人、朋友要以用戶的身份,去看看這個(gè)百度內(nèi)部代號(hào)為“百雀靈”的語(yǔ)音定制項(xiàng)目落地后究竟能帶給我們什么樣的體驗(yàn)和感受。
語(yǔ)音定制后,百度地圖這下把“個(gè)性化”玩到了底
由于有了全語(yǔ)音操控能力,在進(jìn)入“語(yǔ)音定制”功能這件事上,百度地圖也充分利用了語(yǔ)音技術(shù)的優(yōu)勢(shì),除了通過(guò)手動(dòng)點(diǎn)擊地圖首頁(yè)的“出行助手”后進(jìn)入“語(yǔ)音定制”,我們?cè)诖蜷_(kāi)APP后,只需要喚醒“小度小度”后說(shuō)出“錄制我的語(yǔ)音”也能進(jìn)入功能界面。
(喊“小度小度”開(kāi)啟語(yǔ)音包錄制)
語(yǔ)音合成技術(shù)是一套復(fù)雜的技術(shù)體系,這里不多談。僅從我們普通用戶的使用而言,簡(jiǎn)單來(lái)說(shuō),我們能接觸到的主要有三個(gè)階段:提供語(yǔ)音素材、等待后臺(tái)合成、最終上手使用,每一個(gè)階段都關(guān)乎體驗(yàn)是否足夠良好。
過(guò)去地圖界也有類似的語(yǔ)音合成技術(shù),但由于技術(shù)并不足夠成熟,僅限于商用級(jí)別的明星、KOL個(gè)案聲音錄制,畢竟,每一個(gè)聲音都需要花費(fèi)大量時(shí)間到專用的錄音棚采集聲音素材,長(zhǎng)時(shí)間的合成運(yùn)算也需要等上很長(zhǎng)的時(shí)間(往往以月為單位)。
如果給我們普通用戶的個(gè)性化語(yǔ)音定制也是這么一套流程,定制也就失去了用戶體驗(yàn)的意義。
現(xiàn)在,實(shí)際體驗(yàn)下來(lái),百度地圖的語(yǔ)音定制已經(jīng)解決這個(gè)商用技術(shù)走向“民用”的問(wèn)題。
先看聲音素材采集階段。
實(shí)測(cè)只要找一個(gè)相對(duì)安靜的環(huán)境,不管是較少人聲的辦公室還是無(wú)人的會(huì)議室,跟著百度地圖的指引念出20句不超過(guò)15字的素材,采集就能順利完成。這個(gè)過(guò)程中,用戶還可以選擇不同的風(fēng)格的引導(dǎo)語(yǔ)句跟讀,例如卡通素材、影視臺(tái)詞等。
百度地圖原本讓所有人用一套句子應(yīng)當(dāng)也可以,但它沒(méi)有這么做,可見(jiàn)即便素材采集已經(jīng)足夠簡(jiǎn)單,用戶體驗(yàn)的細(xì)節(jié)還是不放過(guò)。
(公司同事紛紛錄制屬于自己的聲音)
錄制完成后,進(jìn)入等待期。百度地圖官方宣布用戶大約需要等待20分鐘,來(lái)進(jìn)行云端的個(gè)性化語(yǔ)音合成。這個(gè)速度相對(duì)于過(guò)去以月為單位的合成速度,已經(jīng)呈現(xiàn)了幾何級(jí)提升。
但是,實(shí)際APP體驗(yàn)時(shí),用戶的等待時(shí)間往往只有15分鐘:
(實(shí)測(cè)等待時(shí)間普遍為15分鐘)
15分鐘后,經(jīng)過(guò)簡(jiǎn)單的設(shè)置,選擇自己的語(yǔ)音包作為APP默認(rèn)語(yǔ)音包,百度地圖各類導(dǎo)航、交互、資訊介紹全部變成用戶自己的聲音,以后甚至借助百度地圖的景區(qū)播報(bào)功能,可以自己當(dāng)自己的導(dǎo)游!
為了當(dāng)場(chǎng)測(cè)驗(yàn)語(yǔ)音效果,響鈴設(shè)置了離辦公室不遠(yuǎn)的星巴克作為目的地,駕車由百度地圖進(jìn)行導(dǎo)航,
(個(gè)人導(dǎo)航語(yǔ)音包實(shí)測(cè)中)
實(shí)話實(shí)說(shuō),最終的個(gè)性化語(yǔ)音包與真人的擬合程度并沒(méi)有達(dá)到100%、一模一樣的水平,但直觀上,八到九成的相似度肯定有,隨機(jī)邀請(qǐng)寫(xiě)字樓的朋友去“喝咖啡”,這位朋友被驚訝到,“怎么會(huì)是你的聲音”,沖擊感十分強(qiáng)烈。
這樣的擬合程度,僅從技術(shù)角度看,在簡(jiǎn)便的素材采集和極短的合成時(shí)間下已經(jīng)非常高。
總體而言,自己和身邊的百度地圖用戶體驗(yàn)下來(lái),最大的感受是“個(gè)性化”做到了極致。
過(guò)去我們老談APP產(chǎn)品的個(gè)性化,但說(shuō)實(shí)話這種個(gè)性化都是“一群一群”的,地圖APP給我們劃定了一個(gè)個(gè)明星包,大家“選擇”自己喜歡的,個(gè)性化程度比過(guò)去的一成不變要好很多。
但是,隨著我們用戶的個(gè)性化需求越來(lái)越強(qiáng),這種“聚類”型的個(gè)性化已經(jīng)難以滿足需要。從語(yǔ)音包到語(yǔ)音定制,AI語(yǔ)音合成讓個(gè)性化真正變成字面意義,每一個(gè)人都開(kāi)始擁有真正屬于自己的“一個(gè)一個(gè)”的個(gè)性化體驗(yàn)和服務(wù)。
你的APP體驗(yàn),只有你才會(huì)有,這才是把個(gè)性化玩到了底。
AI+地圖玩到這個(gè)程度,大家終于不再有選擇困難癥了
選擇困難癥是移動(dòng)互聯(lián)網(wǎng)信息爆炸、產(chǎn)品爆炸、功能爆炸時(shí)代每一個(gè)手機(jī)前的用戶常常犯的毛病,不知道用誰(shuí),有時(shí)候這個(gè)APP好,有時(shí)候又覺(jué)得那個(gè)產(chǎn)品不錯(cuò),結(jié)果手機(jī)里裝塞滿了各種舍不得卸載又不怎么用的APP,常常報(bào)警提醒我們要清理手機(jī)了。
語(yǔ)音定制功能的推出,是百度地圖AI+地圖玩法的深入,徹底的個(gè)性化后,不講其他行業(yè)大道理,起碼用戶的選擇困難癥可能不會(huì)再犯了。
實(shí)際體驗(yàn)下來(lái),理由有三:
1、徹底的個(gè)性化就是用戶粘度的最好來(lái)源
用戶之所以會(huì)選擇困難,原因無(wú)非在于產(chǎn)品或功能的同質(zhì)化,或者即便有差異化的地方,也不足以支撐用戶足夠忠誠(chéng)于某款產(chǎn)品。
一個(gè)顯而易見(jiàn)的事實(shí)是,不少用戶手機(jī)里往往裝了好幾個(gè)地圖APP,在過(guò)去,使用哪個(gè)產(chǎn)是沒(méi)有偏好或者說(shuō)偏好不強(qiáng)的,有時(shí)候用這個(gè)有時(shí)候用那個(gè)。
但是,語(yǔ)音定制可能改變這一狀況。直觀的使用感受就是,當(dāng)語(yǔ)音包的聲音變成自己的聲音時(shí),對(duì)APP的心態(tài)會(huì)發(fā)生變化,不再糾結(jié)選擇誰(shuí),而是自然而然去打開(kāi)那個(gè)“有只屬于自己聲音”的APP,這并不是獵奇或嘗鮮,而是某種歸屬感所帶動(dòng)。
我們常常談?wù)摰挠脩粽扯,不就是需要這樣的與用戶心智上的連接么?
2、外部情感的依從,推動(dòng)了對(duì)APP的使用習(xí)慣
此次百度地圖推出語(yǔ)音定制,不僅僅有成年人錄制聲音的模式,還專門(mén)針對(duì)童聲發(fā)音不清晰、不流暢等情況進(jìn)行了優(yōu)化,如果我們?cè)敢,可以讓孩子的聲音為日常地圖交互增添色彩。
發(fā)布會(huì)現(xiàn)場(chǎng),百度地圖事業(yè)部總經(jīng)理李瑩表示一上線就給其女兒錄制了專屬語(yǔ)音包,并設(shè)置為默認(rèn)。可以說(shuō),此時(shí)的李瑩既是百度地圖的主要負(fù)責(zé)人,也可以代表一個(gè)有孩子的普通用戶。
(百度地圖事業(yè)部總經(jīng)理李瑩)
而響鈴的同事黃女士,以普通用戶的身份也第一時(shí)間錄制了其4歲可愛(ài)女兒的聲音,并設(shè)置為默認(rèn)語(yǔ)音包,按她的話說(shuō),“(對(duì)這個(gè)新功能的)第一感覺(jué)是感動(dòng)”。
(黃女士正在引導(dǎo)女兒跟讀語(yǔ)音采集素材句子)
把現(xiàn)代人最重視的孩子納入到產(chǎn)品體驗(yàn)當(dāng)中來(lái),許多APP產(chǎn)品未必想不到,但是,通過(guò)AI能力的巧妙應(yīng)用,這種體驗(yàn)就順勢(shì)變成了我們用戶的某種情感依從。
不只是孩子,還有現(xiàn)任女朋友、男朋友(如果你想的話,前任也不是不可以)、暗戀的人……地圖APP里有那些你珍視的人的聲音,你還會(huì)犯選擇困難癥嗎?
某種程度上,借助AI技術(shù)優(yōu)質(zhì),百度地圖成功把用戶的外部情感依從,轉(zhuǎn)化到了產(chǎn)品內(nèi)部的使用粘性。
3、技術(shù),永遠(yuǎn)讓產(chǎn)品更豐富、更有趣、更能突破舊有限制
實(shí)測(cè)隨著此次語(yǔ)音定制一同上線的,還有一套帶有某種社交屬性和內(nèi)容平臺(tái)屬性的分享系統(tǒng),我們認(rèn)為雖然官方的宣傳著墨不多,但這套系統(tǒng)更值得玩味。
一方面,我們用戶錄制的個(gè)人語(yǔ)音包可以直接分享給親朋好友,在熟人社交環(huán)境下可以相互分享“聲音”——異地的戀人怕是要感動(dòng)不已。
另一方面,百度地圖上某些“人氣”的語(yǔ)音包,還有可能獲得官方推薦,成為地圖產(chǎn)品里的“好聲音”,而這已經(jīng)超出地圖產(chǎn)品的范疇,帶有某種內(nèi)容創(chuàng)作式的平臺(tái)屬性——雖然百度地圖未必這么想,但從用戶角度看,客觀上就是如此。
一個(gè)聲線優(yōu)美的女生,或者聲音溫暖磁性的男生,某一天或都有了僅通過(guò)聲音質(zhì)量創(chuàng)作內(nèi)容、表現(xiàn)自己的可能,或者,也來(lái)個(gè)語(yǔ)音包界的“網(wǎng)紅”?
輕互動(dòng)、輕社交、輕內(nèi)容……相信更多人不會(huì)再糾結(jié)日常要使用哪個(gè)地圖APP了。
更好的AI,理應(yīng)讓更多人分享
能夠給到我們普通用戶美好體驗(yàn)的技術(shù),背后一定是經(jīng)過(guò)了長(zhǎng)久的磨礪。用戶看到的永遠(yuǎn)只是技術(shù)冰山露出來(lái)的一角,底下是無(wú)數(shù)時(shí)間和實(shí)踐的積累。
語(yǔ)音定制同樣如此,它背后是百度獨(dú)創(chuàng)的“說(shuō)話人”韻律遷移技術(shù)Meitron,按百度語(yǔ)音首席架構(gòu)師賈磊的說(shuō)法,能夠?qū)崿F(xiàn)“發(fā)音人音色轉(zhuǎn)換,多情感朗讀和韻律風(fēng)格遷移”,簡(jiǎn)而言之,即從各個(gè)方面完全學(xué)習(xí)發(fā)音人說(shuō)話,做到合成后的語(yǔ)音與真人語(yǔ)音在各個(gè)方向貼近,讓人分不出。
(百度語(yǔ)音首席架構(gòu)師賈磊)
事實(shí)上,早前央視公益節(jié)目《等著我》與百度合作,利用有限的素材合成已經(jīng)過(guò)世老排長(zhǎng)聲音發(fā)出的句子,讓苦尋他多年的老戰(zhàn)士現(xiàn)場(chǎng)感動(dòng)落淚,就是Meitron所實(shí)現(xiàn)。
更進(jìn)一步看,Meitron背后還有百度語(yǔ)音方面的一系列體系化AI能力,它作為語(yǔ)音合成的一個(gè)分支,本身也是百度語(yǔ)音的重要技術(shù)成果之一。
從百度AI,到百度語(yǔ)音,到Meitron,到語(yǔ)音定制,一環(huán)扣一環(huán),最終個(gè)性化的語(yǔ)音合成定制門(mén)檻大大降低,普通用戶更加直接地觸摸到AI、感知到AI。
我們不必再把AI視為高高在上的存在,它就是我們身邊的技術(shù)。百度地圖的語(yǔ)音定制內(nèi)部代號(hào)是“百雀靈”,這樣來(lái)看是希望所有用戶都定制出自己的語(yǔ)音包,個(gè)性化語(yǔ)音合成的定制門(mén)檻大大降低,每一個(gè)人,都可以做一只擁有專屬聲音的“雀”。
這樣的語(yǔ)音定制可以、也應(yīng)當(dāng)應(yīng)用到更多需要語(yǔ)音交互的產(chǎn)品上,讓那些非地圖場(chǎng)景下的用戶也能有類似的美好體驗(yàn),共同觸摸AI。百度地圖是第一個(gè)帶來(lái)美好技術(shù)體驗(yàn)的產(chǎn)品,相信后面還會(huì)有更多百度系的產(chǎn)品用上這樣的個(gè)性化語(yǔ)音定制。拭目以待吧。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?