聲音定制三天交付,深聲科技如何在語音AI賽道彎道超車?
自2015年開始,中國人工智能市場規(guī)模逐年攀升,2018年中國人工智能市場規(guī)模約為238.2億元,增長率達(dá)到56.6%,據(jù)預(yù)測,到2020年,中國在人工智能的市場規(guī)模將接近500億元。
“語音是AI智能時代的重要入口,”深聲科技創(chuàng)始人周俊明說。他的底氣來自多年的行業(yè)積累和互聯(lián)網(wǎng)產(chǎn)品開發(fā)經(jīng)驗。
2012年,周俊明從中科院計算所博士畢業(yè),順利進入廣電行業(yè)龍頭企業(yè)北京永新視博擔(dān)任高級算法工程師,主要負(fù)責(zé)音視頻算法工作;2013年,他憑借音視頻算法技術(shù)能力,被騰訊選中,故任職于此,繼續(xù)從事在線音視頻算法技術(shù)研發(fā)工作;2016年,他加入了歡聚時代,擔(dān)任音視頻技術(shù)總負(fù)責(zé)人,帶領(lǐng)國內(nèi)頂級音視頻團隊,為YY提供核心技術(shù)服務(wù)和技術(shù)創(chuàng)新方案。
2018年,周俊明和核心團隊成員共同創(chuàng)辦了“深聲科技”,一家智能語音技術(shù)服務(wù)商,主要通過基于深度學(xué)習(xí)的文字轉(zhuǎn)語音整體解決方案服務(wù)B端客戶,提高客戶在行業(yè)內(nèi)的競爭壁壘,幫助客戶形成獨有的競爭優(yōu)勢。據(jù)悉,成立不到半年,深聲科技就獲得了來自小米科技的數(shù)千萬元天使輪融資。
AI行業(yè)從不缺競爭對手,BAT等頭部大企業(yè)有強者的打法,初創(chuàng)企業(yè)也有自己彎道超車的策略。深聲科技在多年的實踐摸索發(fā)現(xiàn),以往客戶在語音合成中最關(guān)心的是信息的傳遞。但隨著物質(zhì)生活的不斷提高,客戶對于語音轉(zhuǎn)化真實感的需求也日益劇增,催生了擬人聲智能營銷、擬人互動、擬人陪伴等大規(guī)模商業(yè)化應(yīng)用場景和價值。基于此邏輯,深聲科技在商業(yè)模式方面主打三大場景:語音內(nèi)容輸出、智能語音交互、智能客服營銷。
其中,內(nèi)容輸出業(yè)務(wù)是深聲科技重點推進的主線業(yè)務(wù),團隊主要通過與有版權(quán)IP的企業(yè)合作,以有聲閱讀的方式將深聲語音呈現(xiàn)給消費者,內(nèi)容涵蓋文學(xué)、動漫、新聞資訊等多種題材和類型。根據(jù)深聲科技提供的數(shù)據(jù)顯示,深聲目前已與十余家行業(yè)頭部的內(nèi)容版權(quán)企業(yè)達(dá)成合作,一方面為企業(yè)提供文字語言轉(zhuǎn)化工具,按字?jǐn)?shù)收費;另一方面,提供語音合成整體解決方案,共同開發(fā)版權(quán)IP的語音形式。
在語音交互業(yè)務(wù)中,團隊依托投資方小米的資源及產(chǎn)品,重點服務(wù)智能語音音箱和車聯(lián)網(wǎng)企業(yè),為其提供語音合成、數(shù)據(jù)制作和人機交互等服務(wù),協(xié)助客戶在產(chǎn)品開發(fā)過程中精準(zhǔn)感知用戶需求,增強行業(yè)競爭優(yōu)勢。
智能客服營銷業(yè)務(wù)是深聲科技正在嘗試的場景,深聲科技主要幫助運營商和金融客戶定制聲音并合成聲音,使其在營銷過程中提高通話時長和營銷轉(zhuǎn)化率。談及看好語音交互和智能客服營銷這兩類客戶群體的原因時,周俊明告訴創(chuàng)業(yè)邦,這兩類客戶對于語音音質(zhì)的要求更高,通過深聲科技自身語音合成技術(shù)的優(yōu)勢能很快產(chǎn)生規(guī);(yīng),且這兩類客戶群體的長期付費能力更強。
從時間的維度上看,深聲科技相比科大訊飛、商湯科技等AI企業(yè)入局較晚,但團隊正在加緊業(yè)務(wù)布局,構(gòu)建自身技術(shù)壁壘。首先,基于端到端的語音合成技術(shù)邏輯,深聲科技會對采集到的原始語音進行自動標(biāo)注,再由聲學(xué)模型算法對語言和語音進行音素級特征對齊,可以實現(xiàn)完全擬人發(fā)聲,將語氣、語調(diào)、語速、抑揚頓挫等語音特點完美呈現(xiàn)。在Blizzard Challenge 2019 國際語音合成大賽中,該技術(shù)在PER(拼音-不包含聲調(diào)-錯誤率)和PTER(拼音-包含聲調(diào)-錯誤率)兩個指標(biāo)上優(yōu)于科大訊飛。此外,團隊在聲音定制合成方面的交付能力突出,三天內(nèi)便可完成,而行業(yè)一般需要3~6個月。
成立不到兩年,團隊已有50多人規(guī)模,其中80%為技術(shù)研發(fā)人員。團隊主要成員擁有中科院、中山大學(xué)、華南理工、日本早稻田大學(xué)等名校碩博教育背景和騰訊、網(wǎng)易、YY等名企工作經(jīng)歷。聯(lián)合創(chuàng)始人黃博賢擁有12年的互聯(lián)網(wǎng)語音和音頻技術(shù)積累,先后在酷狗和YY主導(dǎo)語音和音頻技術(shù)的開發(fā)。
接下來,團隊會重點在效果、性能、數(shù)據(jù)三個維度優(yōu)化算法技術(shù),為各行各業(yè)提供更多標(biāo)準(zhǔn)化解決方案,加速技術(shù)落地,同時完善智能語音交互全鏈路技術(shù)。2020年,團隊還將推出面向C端用戶的語音克隆產(chǎn)品,在陪伴、親子互動、泛娛樂等交互場景全面發(fā)力。
目前,該項目已啟動A輪融資,資金將全部用于團隊建設(shè)及業(yè)務(wù)拓展。
本文相關(guān)的文章列表頁頭圖圖片來源于攝圖網(wǎng),經(jīng)授權(quán)使用。本文為創(chuàng)業(yè)邦原創(chuàng),未經(jīng)授權(quán)不得轉(zhuǎn)載,否則創(chuàng)業(yè)邦將保留向其追究法律責(zé)任的權(quán)利。如需轉(zhuǎn)載或有任何疑問,請聯(lián)系。
作者:王涵

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?