訂閱
糾錯(cuò)
加入自媒體

AI時(shí)代工具應(yīng)用如何轉(zhuǎn)型,或許百度輸入法AI探索版給出了答案

2019-01-17 08:56
深幾度
關(guān)注

1、最直接的影響是,智能語(yǔ)音更準(zhǔn)了,還能離線語(yǔ)音輸入。

未來(lái)用戶不管是在輸入法、搜索引擎說(shuō)出自己的語(yǔ)音,都會(huì)更準(zhǔn)確,甚至可以中英文方言混輸。即使處于地鐵、電梯、隧道或人流密集等離線場(chǎng)景中,依然可以借助百度輸入法進(jìn)行精準(zhǔn)的語(yǔ)音輸入。

過(guò)去用戶往往是語(yǔ)音輸錯(cuò)一個(gè)字就會(huì)花10秒鐘來(lái)修改,而且由于方言、口語(yǔ)、中英文混雜的語(yǔ)言習(xí)慣,語(yǔ)音輸入法是沒辦法適應(yīng)這樣相對(duì)復(fù)雜的熟人環(huán)境的。這種經(jīng)歷讓用戶很難建立長(zhǎng)時(shí)間使用語(yǔ)音輸入法的習(xí)慣。所以雖然各家輸入法都說(shuō)自己有97%以上的準(zhǔn)確率,但實(shí)際情況是,愿意使用語(yǔ)音輸入法的人寥寥無(wú)幾。

不過(guò),無(wú)論是中英文夾雜,還是普通話家鄉(xiāng)話來(lái)回切換,百度輸入法都能準(zhǔn)確識(shí)別,是目前唯一實(shí)現(xiàn)了高精度中英文混合語(yǔ)音輸入、方言免切換語(yǔ)音輸入的輸入法產(chǎn)品。直接影響就是,用戶更愿意用語(yǔ)音輸入法了,用戶習(xí)慣會(huì)在技術(shù)提高的過(guò)程中一點(diǎn)一點(diǎn)普及。

2、AI能真正理解你的語(yǔ)音指令的含義。

所以你可以在輸入法中調(diào)用指令,發(fā)表情斗圖、發(fā)祝福語(yǔ)、發(fā)彈幕、發(fā)文件、OCR等等。滿足與輸入相關(guān)的周邊需求,實(shí)現(xiàn)全語(yǔ)音交互。

百度高級(jí)副總裁王海峰甚至認(rèn)為,輸入法本質(zhì)上是一款人機(jī)交互的工具,AI時(shí)代正在到來(lái),人機(jī)交互的形態(tài)也將隨之革新。未來(lái),百度輸入法將不僅基于手機(jī)端,還將致力于連通包括智能家居、車聯(lián)網(wǎng)等多種終端場(chǎng)景,集多種輸入方式為一體,幫助用戶在各種場(chǎng)景下高效、自如地傳遞信息。

3、在一些特殊場(chǎng)景實(shí)現(xiàn)更復(fù)雜的、具有邏輯層級(jí)的任務(wù)。

語(yǔ)音輸入法過(guò)去的使用場(chǎng)景是相對(duì)狹窄的,在一些邏輯復(fù)雜、場(chǎng)景復(fù)雜的環(huán)境中,往往很難勝任。

2017年年末,我在和一些智能音箱交互工程師探討的時(shí)候,他們提到語(yǔ)音交互因?yàn)槿狈ζ聊伙@示,層級(jí)邏輯很難展開,點(diǎn)外賣不太現(xiàn)實(shí)。但當(dāng)語(yǔ)音理解力更強(qiáng)甚至能和人類對(duì)話的時(shí)候,層級(jí)邏輯自然可以展開,點(diǎn)外賣甚至更復(fù)雜的操作都能實(shí)現(xiàn)。

當(dāng)語(yǔ)音調(diào)用的信息本身是具備可視性、劃分層級(jí)而且直觀易懂甚至縮短大量信息環(huán)節(jié)的時(shí)候。它本質(zhì)上就是一個(gè)更為合理的交互方式。

“流式多級(jí)的截?cái)郃ttention模型”未來(lái)如果能夠進(jìn)一步提高對(duì)語(yǔ)音的理解能力,輸入法或許能像人一樣聰明。未來(lái)的語(yǔ)音不會(huì)像Siri一樣愚蠢,只能被人們調(diào)戲,隨便幾句話就會(huì)陷入邏輯矛盾,就是因?yàn)樵贫丝梢岳斫獾恼Z(yǔ)音的顆粒度足夠細(xì),速度也足夠快。

在未來(lái),智能語(yǔ)音甚至可以理解人們每一句話、每一個(gè)情緒的意義,讓兩人產(chǎn)生真正意義上的“靈魂對(duì)話”。

三、工具的轉(zhuǎn)型

整個(gè)行業(yè)都正在從移動(dòng)時(shí)代向AI時(shí)代過(guò)渡,移動(dòng)時(shí)代產(chǎn)品未來(lái)破局真的全靠AI。

甚至已經(jīng)有人提到,AI時(shí)代的人機(jī)交互應(yīng)該忘掉機(jī)器,因?yàn)槿f(wàn)物皆界面。是的,AI賦能下的人機(jī)交互,將極大弱化人機(jī)交互中機(jī)器的概念。

AI時(shí)代工具應(yīng)用如何轉(zhuǎn)型,或許百度AI輸入法探索版給出了答案

你所接觸的一切物體都可能是一個(gè)隱藏的交互界面,你的動(dòng)作狀態(tài)、情緒以及環(huán)境中發(fā)生的事件,以伴隨的各種變化屬性為橋梁,時(shí)時(shí)刻刻都在被分析被推理,最終的結(jié)果將反映到真實(shí)的物理環(huán)境中,從而更自然地輔助你的日常生活。

在這一過(guò)程中,我們之前無(wú)比依賴的手機(jī)和電腦,可能已經(jīng)退居二線,成為真正的計(jì)算工具,不再和我們直接互動(dòng)了。

企業(yè)從移動(dòng)向AI時(shí)代轉(zhuǎn)型過(guò)程中,在產(chǎn)品層面要想的問題大約就是三點(diǎn):

1、如何把AI融入到移動(dòng)時(shí)代的產(chǎn)品之中,和現(xiàn)有功能產(chǎn)生更自然的嵌入;

2、如何形成AI時(shí)代的人機(jī)交互,讓移動(dòng)時(shí)代的產(chǎn)品在AI交互中形成合理的架構(gòu);

3、如何把移動(dòng)時(shí)代的產(chǎn)品放置在AI的技術(shù)生態(tài)中,繼續(xù)發(fā)揮作用;

我們甚至可以大膽預(yù)測(cè),未來(lái)所有的工具型產(chǎn)品,都離不開智能語(yǔ)音輸入法,因?yàn)橐哉Z(yǔ)音為核心的輸入法,就是重構(gòu)人機(jī)交互的最有效手段。因此百度高級(jí)副總裁王海峰提到:

作為百度AI能力應(yīng)用落地的重要產(chǎn)品之一,百度輸入法正在通過(guò)創(chuàng)新拓展大家的想象力邊界。這款A(yù)I輸入法,不僅是一款滿足用戶當(dāng)下需求的產(chǎn)品,也是為正在到來(lái)的AI時(shí)代所準(zhǔn)備的。百度輸入法將扮演好溝通橋梁的重要角色,讓人機(jī)交互進(jìn)入一個(gè)全新的階段。

AI時(shí)代工具應(yīng)用如何轉(zhuǎn)型,或許百度AI輸入法探索版給出了答案

語(yǔ)音交互方式,甚至比鍵鼠、觸摸屏有更大的信息量。劉慈欣在《鄉(xiāng)村教師》的這段話很形象地點(diǎn)名了未來(lái)語(yǔ)音交互的信息量:

你是想告訴我們,一種沒有記憶遺傳,相互間用聲波進(jìn)行信息交流,并且是以令人難以置信的每秒1至10比特的速率進(jìn)行交流的物種,能創(chuàng)造出5B級(jí)文明?!而且這種文明是在沒有任何外部高級(jí)文明培植的情況下自行進(jìn)化的?!

我們甚至可以這樣預(yù)測(cè),走過(guò)了鍵盤、鼠標(biāo)、觸摸屏等一系列交互手段,在這100年的彎路之后,智能語(yǔ)音為代表的對(duì)話式人工智能將讓人類返璞歸真。

<上一頁(yè)  1  2  
聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)