訂閱
糾錯(cuò)
加入自媒體

語音識(shí)別技術(shù)發(fā)展?jié)u入佳境 AI企業(yè)奮力前行

物聯(lián)網(wǎng)時(shí)代,語音識(shí)別被視作為人機(jī)交互的入口,人工智能和機(jī)器學(xué)習(xí)的迅猛發(fā)展,使語音控制變得更為實(shí)用。雖然語音識(shí)別與生物識(shí)別相比,發(fā)展相對緩慢,但是學(xué)術(shù)界和工業(yè)界對于語音市場都很看好,這意味著未來發(fā)展空間十分巨大。

據(jù)中國語音產(chǎn)業(yè)聯(lián)盟發(fā)布的《2017-2018中國智能語音產(chǎn)業(yè)白皮書》顯示,2014年至2018年,中國智能語音產(chǎn)業(yè)規(guī)模由30億元增長至159.7億元,年平均增長率接近40%。不難發(fā)現(xiàn),語音識(shí)別技術(shù)正在開啟智能新時(shí)代,其中AI公司的力量不可忽視。

AI語音芯片競相涌現(xiàn),產(chǎn)品落地戰(zhàn)打響

隨著語音/聲學(xué)以及人工智能技術(shù)的發(fā)展,語音已經(jīng)被認(rèn)為是下一代人機(jī)交互關(guān)鍵技術(shù)。埃森哲調(diào)研顯示,有77%的受訪中國消費(fèi)者使用智能語音助手,對于獨(dú)立智能語音助手的滿意度達(dá)到97%,因而對其有著更高的期待,希望更多的設(shè)備與之實(shí)現(xiàn)集成,并保證更高的信息透明度。

目前無論是智能音箱還是其他智能設(shè)備,更多的智能都是在云端來實(shí)現(xiàn),但云端存在著語音交互時(shí)延的問題,對網(wǎng)絡(luò)的需求限制了設(shè)備的使用空間,以及由此帶來的數(shù)據(jù)與隱私危機(jī)。為了讓設(shè)備使用場景不受局限,用戶體驗(yàn)更好,端側(cè)智能以成為一種趨勢,語音AI芯片也隨之而來。

與國際科技巨頭一樣,中國的AI公司也在積極推出語音芯片,以支持智能音箱和其他語音助手設(shè)備,讓語音信號(hào)解碼、壓縮和傳輸更加清晰、迅速,從而更好地提高語音識(shí)別能力,提升語音指令的用戶體驗(yàn)。

除了智能家居場景外,對以智能語音交互為核心業(yè)務(wù)的廠商來說,車載市場無疑是另一大領(lǐng)域。隨著越來越多車載語音交互量產(chǎn)車的落地,未來車載芯片設(shè)計(jì)領(lǐng)域也必然會(huì)把語音交互功能作為一大重要板塊進(jìn)行集成。

錯(cuò)詞率不斷降低,語音開放平臺(tái)大放光彩

語音識(shí)別的關(guān)鍵是基于大量樣本數(shù)據(jù)的識(shí)別處理,國內(nèi)大多數(shù)語音識(shí)別技術(shù)商都在平臺(tái)化的方向上發(fā)力,以通過不同平臺(tái)以及軟硬件方面的數(shù)據(jù)和技術(shù)積累不斷提高識(shí)別準(zhǔn)確率。近年來,AI公司不斷深耕行業(yè),紛紛布局智能語音,取得炫目的成就,以人工智能四小龍中的依圖與云從為例,便可窺見一斑:

上榜CB Insights全球AI百強(qiáng)的依圖科技,在中文語音識(shí)別技術(shù)上致力創(chuàng)新,成果斐然。2018年12月,在中文開源數(shù)據(jù)庫AISHELL-2中,依圖短語音聽寫的字錯(cuò)率(CER)僅為3.71%,大幅刷新現(xiàn)有紀(jì)錄。依圖還聯(lián)合微軟Azure推出依圖語音開放平臺(tái),并攜手華為發(fā)布“智能語音聯(lián)合解決方案”,將依圖的語音識(shí)別技術(shù)提供給廣泛的第三方應(yīng)用開發(fā)者,共同推動(dòng)智能語音行業(yè)的進(jìn)步。

云從科技作為人工智能獨(dú)角獸企業(yè),在語音識(shí)別領(lǐng)域亦有不凡表現(xiàn)。2018年10月,云從科技在語音識(shí)別技術(shù)上取得重大突破,在全球大的開源語音識(shí)別數(shù)據(jù)集Librispeech上刷新了世界紀(jì)錄,錯(cuò)詞率(Worderrorrate,WER)降到了2.97%,將Librispeech的WER指標(biāo)提升了25%,超過阿里、百度、約翰霍普金斯大學(xué)等企業(yè)及高校,大幅刷新原先記錄,使得語音識(shí)別離更良好的交互體驗(yàn)越來越近。

結(jié)語:如果說視覺是人獲取信息的主要渠道,那么語音則是人輸出信息的主要渠道。要實(shí)現(xiàn)更好的人工智能體驗(yàn),“視覺+語音+語義”的復(fù)合型AI技術(shù)將缺一不可,尤其在人機(jī)交互場景中。相信隨著智能語音技術(shù)步入黃金期,未來成熟化的語音產(chǎn)品將通過云平臺(tái)和智能硬件平臺(tái)快速實(shí)現(xiàn)商業(yè)化部署。

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)