訂閱
糾錯
加入自媒體

人工智能時代來襲,輸入法如何決勝下一個10年

2020-05-29 10:30
劉曠
關注

黑科技成就輸入法

無論是功能上的全能,還是體驗上的全能,輸入法產(chǎn)品能夠?qū)崿F(xiàn)質(zhì)變,甚至能夠適應一些極限和極端的輸入場景,除了產(chǎn)品本身的創(chuàng)新外,不斷的技術迭代是最核心的原因。用戶之所以能夠只花一半的時間完成整個輸入過程,都依賴于輸入法們背后的黑科技。

訊飛輸入法可以說是“科技成就輸入法”的最佳代言人。一方面,其背靠有20多年智能語音技術沉淀的科大訊飛,已有20萬小時訓練數(shù)據(jù)積累;另一方面,科大訊飛有太多的國際賽事頂尖榮譽,比如在2018年由國際計算語言學協(xié)會(ACL)下屬組織主辦的第十二屆國際語義評測比賽(SemEval2018)中,科大訊飛斬獲了基于常識的機器閱讀理解全球第一;2018年的國際權威英文語音識別大賽“CHiME-6”中,科大訊飛包攬了兩項第一名;2019年在ICDAR2019舉辦的場景文本視覺問答挑戰(zhàn)賽ST-VQA中,科大訊飛包攬了三項冠軍;2020年初在德國The 20BN-Jester Dataset手勢識別評測中,科大訊飛以97.26%的準確率斬獲冠軍,且刷新了世界紀錄……訊飛輸入法背后的黑科技可以從四方面來看。

一、語音輸入

語音輸入講究快速和準確,訊飛輸入法之所以能達到一分鐘400字、識別準確率98%的水平,主要在于其自研的“記憶增強的多通道全端到端語音識別框架”,這項技術簡單來說就是能夠完全將前端語音處理過程深度學習化,并使用深度卷積神經(jīng)網(wǎng)絡和后端識別模型進行混合訓練,從而大大提高了語音識別的效率。

至于能夠使用23種方言進行精準語音輸入,一方面要靠通過多方言共享方式訓練的Multi-lingual多語言建模技術,另一方面要靠GlobalPhone全球音素集,這項技術從聲學層面的相似性來統(tǒng)一各方言的音素定義,使方言“語圖譜”模型進一步精進,從而使得方言識別效果有效提升。多語種互譯功能則對技術提出了更大的挑戰(zhàn)性,以中英互譯為例,訊飛輸入法基于對抗樣本訓練方法提出了融合副語言特征的“高魯棒性語音翻譯技術”,并在模型中結合特定技術,有效提高了最終翻譯結果。

二、拼音輸入

在拼音輸入上,訊飛輸入法創(chuàng)新性引入了Encoder-Decoder框架,構建了新一代拼音識別引擎,極大簡化了傳統(tǒng)拼音識別模型,同時在Attention機制和長短期記憶網(wǎng)絡的門控機制,以及Transformer等模塊的共同作用下,長句輸入識別效果有效提升,能夠提前預測用戶想輸入的內(nèi)容,還能有效實現(xiàn)智能糾錯。

此外,這一模型由于采用的是序列建模,建模不再依賴詞典,更易實現(xiàn)中英文混合建模,因而讓訊飛輸入法在中英混輸上實現(xiàn)了非常出色混輸表現(xiàn)。值得注意的是,不論是智能預測,還是智能糾錯,背后都有可實時更新的百萬詞庫。

三、手寫輸入

同樣是手寫,體驗卻完全不一樣,這是因為訊飛輸入法的手寫識別可支持兩萬多類中文字符、52類英文字符、10類阿拉伯數(shù)字以及100多種特殊符號,這種超級識別能力的背后,是訊飛輸入法的“HWR手寫識別技術”,這項技術采用的是CNN卷積神經(jīng)網(wǎng)絡技術,可支持實時手寫軌跡,邊寫邊出字,而且單個字符識別僅需15ms,響應迅速無延遲。

四、掃描輸入

掃描輸入的技術支撐是計算機視覺,面對復雜的手寫文字、中英混合文字,“OCR文字檢測技術”可檢測任意方向和形狀的文字,“OCR文字識別技術”則可以有效緩解因環(huán)境問題造成的識別效果低下問題。

綜上,基于AI和大數(shù)據(jù)的組合技術,如今的輸入法不再死板堅硬,即使面對輸入場景的復雜需求,也能夠在不同語種、不同語境、不同語調(diào)下滿足不同用戶的需求。過去的輸入法只能輔助,而現(xiàn)在,科技加持下的輸入法,更像是一個“一站式”的輸入管家。

輸入法的智能普惠

黑科技成就了輸入法,也成就了輸入法的地位。根據(jù)相關報告提供的數(shù)據(jù),以三大輸入法為代表的第三方輸入法,已經(jīng)覆蓋了超過90%的中國網(wǎng)民。

要是放大到整個輸入法行業(yè),可以說人人都是輸入法的受益者,移動設備也好,個人電腦也好,日常交流必然離不開輸入法的幫助。可以說,輸入法已經(jīng)成為一個互聯(lián)網(wǎng)溝通的基礎設施。而且值得慶幸的是,訊飛輸入法等頭部產(chǎn)品在技術上的進化,讓這個基礎設施不斷產(chǎn)生質(zhì)變,越來越智能。

應該說,像訊飛輸入法這樣始終癡迷于“科技驅(qū)動”的輸入法產(chǎn)品,是輸入法作為工具產(chǎn)品在價值上得到躍進式提升的關鍵,因為它們用技術無限拔高了輸入法產(chǎn)品的價值上限。換言之,訊飛輸入法們的“科技大法”一定程度上改善了整個互聯(lián)網(wǎng)世界的溝通協(xié)作效率。

技術無上限,輸入法產(chǎn)品也無上限。對9.04億中國互聯(lián)網(wǎng)網(wǎng)民而言,黑科技持續(xù)加持下的輸入法工具,會繼續(xù)為每個用戶提供獨一無二的使用體驗,真正實現(xiàn)全方位的智能普惠。

<上一頁  1  2  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號