AI時(shí)代工具應(yīng)用如何轉(zhuǎn)型,或許百度輸入法AI探索版給出了答案
1、最直接的影響是,智能語(yǔ)音更準(zhǔn)了,還能離線語(yǔ)音輸入。
未來(lái)用戶不管是在輸入法、搜索引擎說(shuō)出自己的語(yǔ)音,都會(huì)更準(zhǔn)確,甚至可以中英文方言混輸。即使處于地鐵、電梯、隧道或人流密集等離線場(chǎng)景中,依然可以借助百度輸入法進(jìn)行精準(zhǔn)的語(yǔ)音輸入。
過(guò)去用戶往往是語(yǔ)音輸錯(cuò)一個(gè)字就會(huì)花10秒鐘來(lái)修改,而且由于方言、口語(yǔ)、中英文混雜的語(yǔ)言習(xí)慣,語(yǔ)音輸入法是沒辦法適應(yīng)這樣相對(duì)復(fù)雜的熟人環(huán)境的。這種經(jīng)歷讓用戶很難建立長(zhǎng)時(shí)間使用語(yǔ)音輸入法的習(xí)慣。所以雖然各家輸入法都說(shuō)自己有97%以上的準(zhǔn)確率,但實(shí)際情況是,愿意使用語(yǔ)音輸入法的人寥寥無(wú)幾。
不過(guò),無(wú)論是中英文夾雜,還是普通話家鄉(xiāng)話來(lái)回切換,百度輸入法都能準(zhǔn)確識(shí)別,是目前唯一實(shí)現(xiàn)了高精度中英文混合語(yǔ)音輸入、方言免切換語(yǔ)音輸入的輸入法產(chǎn)品。直接影響就是,用戶更愿意用語(yǔ)音輸入法了,用戶習(xí)慣會(huì)在技術(shù)提高的過(guò)程中一點(diǎn)一點(diǎn)普及。
2、AI能真正理解你的語(yǔ)音指令的含義。
所以你可以在輸入法中調(diào)用指令,發(fā)表情斗圖、發(fā)祝福語(yǔ)、發(fā)彈幕、發(fā)文件、OCR等等。滿足與輸入相關(guān)的周邊需求,實(shí)現(xiàn)全語(yǔ)音交互。
百度高級(jí)副總裁王海峰甚至認(rèn)為,輸入法本質(zhì)上是一款人機(jī)交互的工具,AI時(shí)代正在到來(lái),人機(jī)交互的形態(tài)也將隨之革新。未來(lái),百度輸入法將不僅基于手機(jī)端,還將致力于連通包括智能家居、車聯(lián)網(wǎng)等多種終端場(chǎng)景,集多種輸入方式為一體,幫助用戶在各種場(chǎng)景下高效、自如地傳遞信息。
3、在一些特殊場(chǎng)景實(shí)現(xiàn)更復(fù)雜的、具有邏輯層級(jí)的任務(wù)。
語(yǔ)音輸入法過(guò)去的使用場(chǎng)景是相對(duì)狹窄的,在一些邏輯復(fù)雜、場(chǎng)景復(fù)雜的環(huán)境中,往往很難勝任。
2017年年末,我在和一些智能音箱交互工程師探討的時(shí)候,他們提到語(yǔ)音交互因?yàn)槿狈ζ聊伙@示,層級(jí)邏輯很難展開,點(diǎn)外賣不太現(xiàn)實(shí)。但當(dāng)語(yǔ)音理解力更強(qiáng)甚至能和人類對(duì)話的時(shí)候,層級(jí)邏輯自然可以展開,點(diǎn)外賣甚至更復(fù)雜的操作都能實(shí)現(xiàn)。
當(dāng)語(yǔ)音調(diào)用的信息本身是具備可視性、劃分層級(jí)而且直觀易懂甚至縮短大量信息環(huán)節(jié)的時(shí)候。它本質(zhì)上就是一個(gè)更為合理的交互方式。
“流式多級(jí)的截?cái)郃ttention模型”未來(lái)如果能夠進(jìn)一步提高對(duì)語(yǔ)音的理解能力,輸入法或許能像人一樣聰明。未來(lái)的語(yǔ)音不會(huì)像Siri一樣愚蠢,只能被人們調(diào)戲,隨便幾句話就會(huì)陷入邏輯矛盾,就是因?yàn)樵贫丝梢岳斫獾恼Z(yǔ)音的顆粒度足夠細(xì),速度也足夠快。
在未來(lái),智能語(yǔ)音甚至可以理解人們每一句話、每一個(gè)情緒的意義,讓兩人產(chǎn)生真正意義上的“靈魂對(duì)話”。
三、工具的轉(zhuǎn)型
整個(gè)行業(yè)都正在從移動(dòng)時(shí)代向AI時(shí)代過(guò)渡,移動(dòng)時(shí)代產(chǎn)品未來(lái)破局真的全靠AI。
甚至已經(jīng)有人提到,AI時(shí)代的人機(jī)交互應(yīng)該忘掉機(jī)器,因?yàn)槿f(wàn)物皆界面。是的,AI賦能下的人機(jī)交互,將極大弱化人機(jī)交互中機(jī)器的概念。
你所接觸的一切物體都可能是一個(gè)隱藏的交互界面,你的動(dòng)作狀態(tài)、情緒以及環(huán)境中發(fā)生的事件,以伴隨的各種變化屬性為橋梁,時(shí)時(shí)刻刻都在被分析被推理,最終的結(jié)果將反映到真實(shí)的物理環(huán)境中,從而更自然地輔助你的日常生活。
在這一過(guò)程中,我們之前無(wú)比依賴的手機(jī)和電腦,可能已經(jīng)退居二線,成為真正的計(jì)算工具,不再和我們直接互動(dòng)了。
企業(yè)從移動(dòng)向AI時(shí)代轉(zhuǎn)型過(guò)程中,在產(chǎn)品層面要想的問題大約就是三點(diǎn):
1、如何把AI融入到移動(dòng)時(shí)代的產(chǎn)品之中,和現(xiàn)有功能產(chǎn)生更自然的嵌入;
2、如何形成AI時(shí)代的人機(jī)交互,讓移動(dòng)時(shí)代的產(chǎn)品在AI交互中形成合理的架構(gòu);
3、如何把移動(dòng)時(shí)代的產(chǎn)品放置在AI的技術(shù)生態(tài)中,繼續(xù)發(fā)揮作用;
我們甚至可以大膽預(yù)測(cè),未來(lái)所有的工具型產(chǎn)品,都離不開智能語(yǔ)音輸入法,因?yàn)橐哉Z(yǔ)音為核心的輸入法,就是重構(gòu)人機(jī)交互的最有效手段。因此百度高級(jí)副總裁王海峰提到:
作為百度AI能力應(yīng)用落地的重要產(chǎn)品之一,百度輸入法正在通過(guò)創(chuàng)新拓展大家的想象力邊界。這款A(yù)I輸入法,不僅是一款滿足用戶當(dāng)下需求的產(chǎn)品,也是為正在到來(lái)的AI時(shí)代所準(zhǔn)備的。百度輸入法將扮演好溝通橋梁的重要角色,讓人機(jī)交互進(jìn)入一個(gè)全新的階段。
語(yǔ)音交互方式,甚至比鍵鼠、觸摸屏有更大的信息量。劉慈欣在《鄉(xiāng)村教師》的這段話很形象地點(diǎn)名了未來(lái)語(yǔ)音交互的信息量:
你是想告訴我們,一種沒有記憶遺傳,相互間用聲波進(jìn)行信息交流,并且是以令人難以置信的每秒1至10比特的速率進(jìn)行交流的物種,能創(chuàng)造出5B級(jí)文明?!而且這種文明是在沒有任何外部高級(jí)文明培植的情況下自行進(jìn)化的?!
我們甚至可以這樣預(yù)測(cè),走過(guò)了鍵盤、鼠標(biāo)、觸摸屏等一系列交互手段,在這100年的彎路之后,智能語(yǔ)音為代表的對(duì)話式人工智能將讓人類返璞歸真。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?