看科技巨頭如何搶灘語(yǔ)音識(shí)別技術(shù)
摘要:AI語(yǔ)音交互產(chǎn)業(yè)的風(fēng)口已至?
引言
在過(guò)去的半個(gè)月中,國(guó)內(nèi)人工智能領(lǐng)域的融資消息幾乎被AI語(yǔ)音交互搶占,智能語(yǔ)音交互系統(tǒng)研發(fā)商蛙聲科技獲得天使輪融資,遠(yuǎn)望資本投資;圖靈機(jī)器人完成3.5億元B+輪融資,投資方為中一資本、前海梧桐并購(gòu)基金;語(yǔ)音技術(shù)提供商思必馳宣布完成D輪5億元融資,由元禾控股、中國(guó)民生投資集團(tuán)領(lǐng)投,深創(chuàng)投、富士康、聯(lián)發(fā)科跟投。這是否意味著繼亞馬遜、谷歌、蘋(píng)果等國(guó)際科技巨頭在AI語(yǔ)音交互戰(zhàn)略熱潮后,國(guó)內(nèi)以中文為基礎(chǔ)的AI語(yǔ)音交互產(chǎn)業(yè)的風(fēng)口已經(jīng)到來(lái)?
一、智能語(yǔ)音技術(shù)成果顯著,商業(yè)化落地初具規(guī)模、市場(chǎng)潛力如何?
AI語(yǔ)音交互技術(shù)的落地需要有扎實(shí)的語(yǔ)音識(shí)別技術(shù)、強(qiáng)大的語(yǔ)言處理能力及準(zhǔn)確的數(shù)據(jù)支撐。搭載了語(yǔ)音交互系統(tǒng)的智能硬件,便是物聯(lián)網(wǎng)時(shí)代呈現(xiàn),而智能硬件生態(tài)圈的布局也是實(shí)現(xiàn)場(chǎng)景化應(yīng)用的重要因素。
繼Siri、 GoogleNow、Cortana及Alexa的智能語(yǔ)音逐步達(dá)到成熟的應(yīng)用階段后,智能語(yǔ)音正在以最自然的交互方式潛移默化地改變著我們的生活。
隨著AI技術(shù)的不斷深入,智能語(yǔ)音的應(yīng)用范圍也在不斷拓展。無(wú)論是教育、醫(yī)療、客服、電信等傳統(tǒng)行業(yè),還是智能家居、移動(dòng)互聯(lián)網(wǎng)、汽車電子終端、智能機(jī)器人、智能客服等新興領(lǐng)域,智能語(yǔ)音早已成為百搭標(biāo)配,語(yǔ)音功能也幾乎成為了“智能”的代名詞。在巨大的潛在市場(chǎng)面前,國(guó)內(nèi)企業(yè)諸如科大訊飛、思必馳、云知聲、捷通華聲、百度等公司在智能家居、智能車載、智能可穿戴等領(lǐng)域都已積極入局。
二、AI加持下的語(yǔ)音交互技術(shù)現(xiàn)有水平到底怎樣?
在智能語(yǔ)音進(jìn)階的過(guò)程中,“先讓機(jī)器聽(tīng)到、聽(tīng)懂、反饋,再讓機(jī)器思考、溝通、決策”是諸多智能語(yǔ)音企業(yè)的愿景,而技術(shù)實(shí)力則是實(shí)現(xiàn)該愿景的第一話語(yǔ)權(quán)。
方象知產(chǎn)研究院基于AI語(yǔ)音交互技術(shù)現(xiàn)有水平進(jìn)行分析歸納總結(jié)(見(jiàn)表一),對(duì)表中的關(guān)鍵核心技術(shù)進(jìn)行分析發(fā)現(xiàn),就技術(shù)通路而言,AI語(yǔ)音交互技術(shù)囊括了一條完整的人工智能路徑。一套完整的AI語(yǔ)音交互系統(tǒng)需要不同層次的技術(shù)支撐,除了需要具備AI大腦感知、AI大腦認(rèn)知及AI大腦決策三個(gè)層面,還要具備語(yǔ)音識(shí)別、自然語(yǔ)言處理及語(yǔ)音合成三大模塊,其中蘊(yùn)含著語(yǔ)音識(shí)別(ASR)、語(yǔ)義理解(NLU)、自然語(yǔ)言生成(NLG)及語(yǔ)音合成(TTS)四項(xiàng)關(guān)鍵核心技術(shù)。
表一:AI語(yǔ)音交互技術(shù)現(xiàn)狀解析
方象知產(chǎn)研究院整理
據(jù)統(tǒng)計(jì),語(yǔ)音識(shí)別技術(shù)、自然語(yǔ)言處理技術(shù)及語(yǔ)音合成技術(shù)的全球?qū)@暾?qǐng)量呈逐年上升趨勢(shì)。2017年各項(xiàng)技術(shù)的全球申請(qǐng)量分別約為400項(xiàng)、130項(xiàng)及22項(xiàng),其中申請(qǐng)主體主要集中在蘋(píng)果、微軟、谷歌及百度等公司。在產(chǎn)業(yè)化過(guò)程中,感知、認(rèn)知和智能決策是三個(gè)不斷深化發(fā)展的過(guò)程,目前AI語(yǔ)音交互技術(shù)正在經(jīng)歷從感知智能、向認(rèn)知智能的飛躍。
三、技術(shù)價(jià)值角度解析技術(shù)前景、發(fā)展趨勢(shì)及投資分散點(diǎn)在哪里?
AI語(yǔ)音交互能夠完成怎樣的獨(dú)有任務(wù)并體現(xiàn)其價(jià)值呢?基于上述分析,方象知產(chǎn)研究院認(rèn)為,持續(xù)的數(shù)據(jù)積累與技術(shù)升級(jí)是AI語(yǔ)音交互未來(lái)發(fā)展的趨勢(shì),更加智能與流暢的技術(shù)實(shí)現(xiàn)、快速便捷地達(dá)成指令、隱私安全性的保障等都是尚需突破的技術(shù)關(guān)鍵點(diǎn)。
AI語(yǔ)音交互需要在具體的應(yīng)用場(chǎng)景中高效、便捷地解決人機(jī)交互需求才能產(chǎn)生價(jià)值,合適的語(yǔ)音入口是關(guān)鍵。智能音箱、智能電視、家庭機(jī)器人、車載場(chǎng)景、可穿戴設(shè)備等都有可能成為AI語(yǔ)音交互技術(shù)的關(guān)鍵應(yīng)用場(chǎng)景,也會(huì)是當(dāng)前積極布局AI語(yǔ)音交互的科技巨頭們的必爭(zhēng)之地。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?