語音識(shí)別技術(shù)發(fā)展?jié)u入佳境 AI企業(yè)奮力前行
物聯(lián)網(wǎng)時(shí)代,語音識(shí)別被視作為人機(jī)交互的入口,人工智能和機(jī)器學(xué)習(xí)的迅猛發(fā)展,使語音控制變得更為實(shí)用。雖然語音識(shí)別與生物識(shí)別相比,發(fā)展相對緩慢,但是學(xué)術(shù)界和工業(yè)界對于語音市場都很看好,這意味著未來發(fā)展空間十分巨大。
據(jù)中國語音產(chǎn)業(yè)聯(lián)盟發(fā)布的《2017-2018中國智能語音產(chǎn)業(yè)白皮書》顯示,2014年至2018年,中國智能語音產(chǎn)業(yè)規(guī)模由30億元增長至159.7億元,年平均增長率接近40%。不難發(fā)現(xiàn),語音識(shí)別技術(shù)正在開啟智能新時(shí)代,其中AI公司的力量不可忽視。
AI語音芯片競相涌現(xiàn),產(chǎn)品落地戰(zhàn)打響
隨著語音/聲學(xué)以及人工智能技術(shù)的發(fā)展,語音已經(jīng)被認(rèn)為是下一代人機(jī)交互關(guān)鍵技術(shù)。埃森哲調(diào)研顯示,有77%的受訪中國消費(fèi)者使用智能語音助手,對于獨(dú)立智能語音助手的滿意度達(dá)到97%,因而對其有著更高的期待,希望更多的設(shè)備與之實(shí)現(xiàn)集成,并保證更高的信息透明度。
目前無論是智能音箱還是其他智能設(shè)備,更多的智能都是在云端來實(shí)現(xiàn),但云端存在著語音交互時(shí)延的問題,對網(wǎng)絡(luò)的需求限制了設(shè)備的使用空間,以及由此帶來的數(shù)據(jù)與隱私危機(jī)。為了讓設(shè)備使用場景不受局限,用戶體驗(yàn)更好,端側(cè)智能以成為一種趨勢,語音AI芯片也隨之而來。
與國際科技巨頭一樣,中國的AI公司也在積極推出語音芯片,以支持智能音箱和其他語音助手設(shè)備,讓語音信號(hào)解碼、壓縮和傳輸更加清晰、迅速,從而更好地提高語音識(shí)別能力,提升語音指令的用戶體驗(yàn)。
除了智能家居場景外,對以智能語音交互為核心業(yè)務(wù)的廠商來說,車載市場無疑是另一大領(lǐng)域。隨著越來越多車載語音交互量產(chǎn)車的落地,未來車載芯片設(shè)計(jì)領(lǐng)域也必然會(huì)把語音交互功能作為一大重要板塊進(jìn)行集成。
錯(cuò)詞率不斷降低,語音開放平臺(tái)大放光彩
語音識(shí)別的關(guān)鍵是基于大量樣本數(shù)據(jù)的識(shí)別處理,國內(nèi)大多數(shù)語音識(shí)別技術(shù)商都在平臺(tái)化的方向上發(fā)力,以通過不同平臺(tái)以及軟硬件方面的數(shù)據(jù)和技術(shù)積累不斷提高識(shí)別準(zhǔn)確率。近年來,AI公司不斷深耕行業(yè),紛紛布局智能語音,取得炫目的成就,以人工智能四小龍中的依圖與云從為例,便可窺見一斑:
上榜CB Insights全球AI百強(qiáng)的依圖科技,在中文語音識(shí)別技術(shù)上致力創(chuàng)新,成果斐然。2018年12月,在中文開源數(shù)據(jù)庫AISHELL-2中,依圖短語音聽寫的字錯(cuò)率(CER)僅為3.71%,大幅刷新現(xiàn)有紀(jì)錄。依圖還聯(lián)合微軟Azure推出依圖語音開放平臺(tái),并攜手華為發(fā)布“智能語音聯(lián)合解決方案”,將依圖的語音識(shí)別技術(shù)提供給廣泛的第三方應(yīng)用開發(fā)者,共同推動(dòng)智能語音行業(yè)的進(jìn)步。
云從科技作為人工智能獨(dú)角獸企業(yè),在語音識(shí)別領(lǐng)域亦有不凡表現(xiàn)。2018年10月,云從科技在語音識(shí)別技術(shù)上取得重大突破,在全球大的開源語音識(shí)別數(shù)據(jù)集Librispeech上刷新了世界紀(jì)錄,錯(cuò)詞率(Worderrorrate,WER)降到了2.97%,將Librispeech的WER指標(biāo)提升了25%,超過阿里、百度、約翰霍普金斯大學(xué)等企業(yè)及高校,大幅刷新原先記錄,使得語音識(shí)別離更良好的交互體驗(yàn)越來越近。
結(jié)語:如果說視覺是人獲取信息的主要渠道,那么語音則是人輸出信息的主要渠道。要實(shí)現(xiàn)更好的人工智能體驗(yàn),“視覺+語音+語義”的復(fù)合型AI技術(shù)將缺一不可,尤其在人機(jī)交互場景中。相信隨著智能語音技術(shù)步入黃金期,未來成熟化的語音產(chǎn)品將通過云平臺(tái)和智能硬件平臺(tái)快速實(shí)現(xiàn)商業(yè)化部署。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評 >> 【評選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?