語音識(shí)別技術(shù)發(fā)展?jié)u入佳境 AI企業(yè)奮力前行
物聯(lián)網(wǎng)時(shí)代,語音識(shí)別被視作為人機(jī)交互的入口,人工智能和機(jī)器學(xué)習(xí)的迅猛發(fā)展,使語音控制變得更為實(shí)用。雖然語音識(shí)別與生物識(shí)別相比,發(fā)展相對(duì)緩慢,但是學(xué)術(shù)界和工業(yè)界對(duì)于語音市場(chǎng)都很看好,這意味著未來發(fā)展空間十分巨大。
據(jù)中國(guó)語音產(chǎn)業(yè)聯(lián)盟發(fā)布的《2017-2018中國(guó)智能語音產(chǎn)業(yè)白皮書》顯示,2014年至2018年,中國(guó)智能語音產(chǎn)業(yè)規(guī)模由30億元增長(zhǎng)至159.7億元,年平均增長(zhǎng)率接近40%。不難發(fā)現(xiàn),語音識(shí)別技術(shù)正在開啟智能新時(shí)代,其中AI公司的力量不可忽視。
AI語音芯片競(jìng)相涌現(xiàn),產(chǎn)品落地戰(zhàn)打響
隨著語音/聲學(xué)以及人工智能技術(shù)的發(fā)展,語音已經(jīng)被認(rèn)為是下一代人機(jī)交互關(guān)鍵技術(shù)。埃森哲調(diào)研顯示,有77%的受訪中國(guó)消費(fèi)者使用智能語音助手,對(duì)于獨(dú)立智能語音助手的滿意度達(dá)到97%,因而對(duì)其有著更高的期待,希望更多的設(shè)備與之實(shí)現(xiàn)集成,并保證更高的信息透明度。
目前無論是智能音箱還是其他智能設(shè)備,更多的智能都是在云端來實(shí)現(xiàn),但云端存在著語音交互時(shí)延的問題,對(duì)網(wǎng)絡(luò)的需求限制了設(shè)備的使用空間,以及由此帶來的數(shù)據(jù)與隱私危機(jī)。為了讓設(shè)備使用場(chǎng)景不受局限,用戶體驗(yàn)更好,端側(cè)智能以成為一種趨勢(shì),語音AI芯片也隨之而來。
與國(guó)際科技巨頭一樣,中國(guó)的AI公司也在積極推出語音芯片,以支持智能音箱和其他語音助手設(shè)備,讓語音信號(hào)解碼、壓縮和傳輸更加清晰、迅速,從而更好地提高語音識(shí)別能力,提升語音指令的用戶體驗(yàn)。
除了智能家居場(chǎng)景外,對(duì)以智能語音交互為核心業(yè)務(wù)的廠商來說,車載市場(chǎng)無疑是另一大領(lǐng)域。隨著越來越多車載語音交互量產(chǎn)車的落地,未來車載芯片設(shè)計(jì)領(lǐng)域也必然會(huì)把語音交互功能作為一大重要板塊進(jìn)行集成。
錯(cuò)詞率不斷降低,語音開放平臺(tái)大放光彩
語音識(shí)別的關(guān)鍵是基于大量樣本數(shù)據(jù)的識(shí)別處理,國(guó)內(nèi)大多數(shù)語音識(shí)別技術(shù)商都在平臺(tái)化的方向上發(fā)力,以通過不同平臺(tái)以及軟硬件方面的數(shù)據(jù)和技術(shù)積累不斷提高識(shí)別準(zhǔn)確率。近年來,AI公司不斷深耕行業(yè),紛紛布局智能語音,取得炫目的成就,以人工智能四小龍中的依圖與云從為例,便可窺見一斑:
上榜CB Insights全球AI百?gòu)?qiáng)的依圖科技,在中文語音識(shí)別技術(shù)上致力創(chuàng)新,成果斐然。2018年12月,在中文開源數(shù)據(jù)庫(kù)AISHELL-2中,依圖短語音聽寫的字錯(cuò)率(CER)僅為3.71%,大幅刷新現(xiàn)有紀(jì)錄。依圖還聯(lián)合微軟Azure推出依圖語音開放平臺(tái),并攜手華為發(fā)布“智能語音聯(lián)合解決方案”,將依圖的語音識(shí)別技術(shù)提供給廣泛的第三方應(yīng)用開發(fā)者,共同推動(dòng)智能語音行業(yè)的進(jìn)步。
云從科技作為人工智能獨(dú)角獸企業(yè),在語音識(shí)別領(lǐng)域亦有不凡表現(xiàn)。2018年10月,云從科技在語音識(shí)別技術(shù)上取得重大突破,在全球大的開源語音識(shí)別數(shù)據(jù)集Librispeech上刷新了世界紀(jì)錄,錯(cuò)詞率(Worderrorrate,WER)降到了2.97%,將Librispeech的WER指標(biāo)提升了25%,超過阿里、百度、約翰霍普金斯大學(xué)等企業(yè)及高校,大幅刷新原先記錄,使得語音識(shí)別離更良好的交互體驗(yàn)越來越近。
結(jié)語:如果說視覺是人獲取信息的主要渠道,那么語音則是人輸出信息的主要渠道。要實(shí)現(xiàn)更好的人工智能體驗(yàn),“視覺+語音+語義”的復(fù)合型AI技術(shù)將缺一不可,尤其在人機(jī)交互場(chǎng)景中。相信隨著智能語音技術(shù)步入黃金期,未來成熟化的語音產(chǎn)品將通過云平臺(tái)和智能硬件平臺(tái)快速實(shí)現(xiàn)商業(yè)化部署。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡(jiǎn)單
- 10 “搶灘”家用機(jī)器人領(lǐng)域,聯(lián)通、海爾、美的等紛紛入局