AI機(jī)器人喊出“中國臺灣省” 語音識別揭秘其愛國本源!
語義識別是聊天機(jī)器人的下一步
如果是臺灣的這款A(yù)I機(jī)器人說出“中國臺灣省”不過是基于語音庫作出的自然選擇,只能證明是聊天機(jī)器人在語音識別的階段的基本表現(xiàn)。那么,達(dá)到語義識別的聊天機(jī)器人又會有哪些表現(xiàn)呢?
在聊天機(jī)器人的背后,其實(shí)是一套復(fù)雜的系統(tǒng),主要包括5個功能模塊:語音識別模塊、自然語言理解模塊、對話管理模塊、自然語言生成模塊、語音合成模塊。
首先,語音識別模塊負(fù)責(zé)接收用戶輸入的語音并將其轉(zhuǎn)換成文字形式。
然后,自然語言理解模塊在理解了用戶輸入的語義之后將特定的語義表達(dá)式輸入到對話管理模塊中。
接著,對話管理模塊負(fù)責(zé)協(xié)調(diào)各個模塊的調(diào)用及維護(hù)當(dāng)前對話狀態(tài),選擇特定的回復(fù)方式并交由自然語言生成模塊進(jìn)行處理。
最后,自然語言生成模塊生成回復(fù)文本輸入給語音合成模塊將文字轉(zhuǎn)換成語音輸出給用戶。
通常來說,聊天機(jī)器人系統(tǒng)中的自然語言理解功能包括用戶意圖識別、用戶情感識別、指代消解、省略恢復(fù)、回復(fù)確認(rèn)及拒識判斷等技術(shù)。
對話管理功能主要協(xié)調(diào)聊天機(jī)器人的各個部分,并維護(hù)對話的結(jié)構(gòu)和狀態(tài)。對話管理功能中涉及到的關(guān)鍵技術(shù)主要有對話行為識別、對話狀態(tài)識別、對話策略學(xué)習(xí)及對話獎勵等。
自然語言生成通常根據(jù)對話管理部分產(chǎn)生的非語言信息,自動生成面向用戶的自然語言反饋。
目前來看,人類不過剛剛邁過了語音識別的門檻,甚至科大訊飛等公司中文的識別的準(zhǔn)確率提升到97%以上,但是機(jī)器人作出的反饋則是基于語音庫的自然連接,和被動輸出已經(jīng)形成的答案。聊天機(jī)器人在現(xiàn)階段還做不到自己對聊天內(nèi)容理解基礎(chǔ)上的回答。曾經(jīng)因接受采訪而聲名鵲起的索菲亞機(jī)器人,后來被證明不過是通過后臺控制只能背誦標(biāo)準(zhǔn)答案的騙子。
點(diǎn)評:聊天機(jī)器人不神秘也不神話,它不過是語音識別在智能機(jī)器人身上的一個應(yīng)用罷了。目前語音識別還難以突破語義理解的門檻,哪天人類在語義理解上突破了語義理解的瓶頸,讓機(jī)器人能真正聽懂人話,真正的AI機(jī)器人時代才會到來。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動力電池技術(shù)應(yīng)用大會
-
免費(fèi)參會立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬 APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語權(quán)
- 3 深度報(bào)告|中國AI產(chǎn)業(yè)正在崛起成全球力量,市場潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 一文看懂視覺語言動作模型(VLA)及其應(yīng)用
- 6 國家數(shù)據(jù)局局長劉烈宏調(diào)研格創(chuàng)東智
- 7 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 8 百億AI芯片訂單,瘋狂傾銷中東?
- 9 Robotaxi新消息密集釋放,量產(chǎn)元年誰在領(lǐng)跑?
- 10 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡單