2021精品国产品免费观看,伊人久久精品一区二区三区,国产精品久久久久精品综合紧

陷入“人機(jī)耦合”的AI同傳：向人類(lèi)偷師、與人類(lèi)共事

2018-10-26 10:23

最近科技圈里火了一個(gè)詞叫“人機(jī)耦合”，主要原因當(dāng)然是因?yàn)榇饲翱拼笥嶏w人工同傳“假扮”AI同傳，而科大訊飛將這種人工寫(xiě)出譯文、機(jī)器發(fā)音的方式稱(chēng)為人機(jī)耦合，而用戶(hù)們則用這個(gè)詞表示對(duì)科大訊飛的調(diào)侃。

這也再度加大了AI同傳在機(jī)器翻譯領(lǐng)域中的關(guān)注度相，除了大眾印象中的造假，對(duì)于行業(yè)內(nèi)來(lái)說(shuō)，AI同傳任務(wù)處理上實(shí)時(shí)性、專(zhuān)業(yè)度的要求都極高，容錯(cuò)率也相對(duì)更低，在機(jī)器翻譯領(lǐng)域算是一個(gè)難度很大的任務(wù)，甚至有人稱(chēng)之為機(jī)器翻譯的“圣杯”。解決好AI同傳問(wèn)題，也就標(biāo)志著這家企業(yè)在機(jī)器翻譯技術(shù)已經(jīng)達(dá)到一定高度，解決其他問(wèn)也也不在話下。

是圣杯，自然少不了挑戰(zhàn)者。除了孜孜不倦的獨(dú)角獸，微軟、百度、谷歌等海內(nèi)外的AI大廠也都在不斷攻克這項(xiàng)難題。但今天我們想來(lái)談?wù)劦氖牵珹I同傳真正的“人機(jī)耦合”到底應(yīng)該是什么樣？

是什么為AI同傳送上圣杯

AI同傳之所以難度能夠達(dá)到“圣杯級(jí)別”，還是來(lái)自于語(yǔ)言本身的復(fù)雜程度和不同語(yǔ)言之間的巨大差異。

給前者舉個(gè)例子，對(duì)于機(jī)器翻譯，尤其是語(yǔ)音轉(zhuǎn)碼文字的部分來(lái)說(shuō)一個(gè)很大的難點(diǎn)就是同音不同字，有其有的詞同音不同字并且意義差距很大。比如南方or男方。

后者則主要體現(xiàn)在語(yǔ)序的差異上，中文上說(shuō)“她送給我的花很美”，英文上卻說(shuō)“The flowers she gave me are beautiful”，在不聽(tīng)完整個(gè)句子之前，是很難給出準(zhǔn)確翻譯結(jié)果的，因?yàn)樵谠谥形闹凶鳛橹髡Z(yǔ)我“花”出現(xiàn)在“她送給我”這一定語(yǔ)之后，可英文中主語(yǔ)“The flowers”卻出現(xiàn)在句子的開(kāi)頭。

所以目前大多數(shù)AI同傳，要么是等待一個(gè)完整的句子說(shuō)完后，再進(jìn)行翻譯，要么是根據(jù)當(dāng)前識(shí)別結(jié)果進(jìn)行翻譯，然后隨著識(shí)別字?jǐn)?shù)的增加，不斷修正結(jié)果。

不管哪種方式，基本上都帶有一個(gè)句子的延遲時(shí)間。尤其是遇到同音不同字的問(wèn)題時(shí)，很多同傳系統(tǒng)只要認(rèn)定了第一次識(shí)別的語(yǔ)音，很難再根據(jù)語(yǔ)境調(diào)整語(yǔ)音和文字之間對(duì)照。這就有可能導(dǎo)致整個(gè)句子在翻譯時(shí)出現(xiàn)嚴(yán)重的誤差。

可我們應(yīng)用同傳，不就是為了和整場(chǎng)對(duì)話同步獲得信息嗎？想象一下，在重要商務(wù)場(chǎng)合中你和合作伙伴談笑風(fēng)生，然而合作伙伴說(shuō)“前門(mén)樓子”AI同傳卻告訴你“胯骨軸子”……

總之由于應(yīng)用場(chǎng)景相對(duì)苛刻，AI同傳的技術(shù)遲遲都沒(méi)能達(dá)到應(yīng)用條件。

萬(wàn)能的人類(lèi)老師，是如何做同聲傳譯的？

那么人類(lèi)又是如何解決這些問(wèn)題的呢？

首先，人類(lèi)譯員在進(jìn)行同傳翻譯時(shí)往往會(huì)先做大量的準(zhǔn)備工作，了解應(yīng)用領(lǐng)域的專(zhuān)業(yè)術(shù)語(yǔ)，本質(zhì)上是對(duì)自己的詞匯庫(kù)進(jìn)行一個(gè)“收斂”，又對(duì)該專(zhuān)業(yè)領(lǐng)域的用詞進(jìn)行學(xué)，減少同音近義、一詞多義時(shí)發(fā)生翻譯錯(cuò)誤的可能。

建立在準(zhǔn)備的基礎(chǔ)上，譯員在進(jìn)行翻譯時(shí)會(huì)有一定的預(yù)測(cè)性，例如“The flowers she gave me are beautiful”這句話的翻譯中，看到“The flowers”這個(gè)單詞，譯員就可以結(jié)合上下文和語(yǔ)境去判斷花一定是別人贈(zèng)送來(lái)的，所以可以同步翻譯出“她送給我的花”。這樣一來(lái)就可以趕在句子說(shuō)完前就進(jìn)行翻譯，盡可能的保證即時(shí)性。

可即便如此，人工同聲傳譯也并不是完美的。由于信息量巨大，譯員只能在保證速度的前提下?tīng)奚徊糠仲|(zhì)量。據(jù)了解，同傳譯員的譯出率僅有60－70％左右，即講話人講了100個(gè)句子，僅有60－70個(gè)句子的信息被完整傳遞給聽(tīng)眾。同時(shí)由于需要高度精神集中，譯員往往需要每15－20分鐘就需要換班休息。

向人類(lèi)偷師，哪些機(jī)器翻譯技術(shù)正在人機(jī)耦合？

而這些人類(lèi)在工作時(shí)體現(xiàn)的智慧和優(yōu)勢(shì)，往往會(huì)被人工智能學(xué)習(xí)和利用。我們可以發(fā)現(xiàn)，很多機(jī)器翻譯技術(shù)已經(jīng)開(kāi)始學(xué)會(huì)利用“背景知識(shí)”和“預(yù)測(cè)”這兩個(gè)關(guān)鍵邏輯了。

從背景知識(shí)的層面來(lái)講，人類(lèi)之所以能夠分辨同音近音字，是因?yàn)閷?duì)于語(yǔ)境和背景知識(shí)有著充足的了解，把不符合當(dāng)前詞匯庫(kù)的同音詞“剔除”了。

所以現(xiàn)在有一些機(jī)器翻譯技術(shù)開(kāi)始應(yīng)用上了這樣的解決方案：提升容錯(cuò)率，忽略語(yǔ)音－文字轉(zhuǎn)碼階段的錯(cuò)誤，進(jìn)而去提升文字翻譯階段的正確率。

例如百度同傳的“語(yǔ)音容錯(cuò)”的對(duì)抗訓(xùn)練翻譯模型，重點(diǎn)就在于有意在訓(xùn)練數(shù)據(jù)集中加入針對(duì)性的噪聲數(shù)據(jù)，這樣即使模型接受到錯(cuò)誤的語(yǔ)音識(shí)別結(jié)果時(shí)，也能給出正確的譯文。什么叫“針對(duì)性”的噪聲數(shù)據(jù)呢？就是把成對(duì)、成組出現(xiàn)的噪聲詞一起收錄，比如前文提到的南方和男方，再將源語(yǔ)言句子進(jìn)行替換，把“南方天氣很潮濕”替換為“男方天氣很潮濕”，而兩個(gè)句子的結(jié)果都設(shè)定為“The weather is very humid in the south”，一起用作訓(xùn)練從而提升模型的容錯(cuò)能力。

而清華大學(xué)也曾經(jīng)發(fā)布過(guò)一篇論文，推出了一種應(yīng)用于語(yǔ)音識(shí)別的快速容錯(cuò)算法，則是通過(guò)前序?qū)υ拕澏ㄔ~典范圍提前剪枝，限制了算法的搜索空間。例如雙方的對(duì)話提到“電話號(hào)碼”，那么接下來(lái)語(yǔ)音對(duì)話中的“yī èr sān sì”就會(huì)更傾向于轉(zhuǎn)碼成“一二三四”，而不會(huì)在“醫(yī)衣依……”等等詞典中進(jìn)行匹配搜索。

至于預(yù)測(cè)性，在機(jī)器翻譯領(lǐng)域中應(yīng)用的也不少。在NLP領(lǐng)域中應(yīng)用頗多的文本生成技術(shù)，已經(jīng)可以做到補(bǔ)完缺詞句子的工作。

像Facebook推出的無(wú)監(jiān)督機(jī)器翻譯，就是對(duì)語(yǔ)言模型進(jìn)行局部編輯，圈定一個(gè)可嵌入的單詞范圍，再為不同的單詞排序打分，流暢的句子得分要高于語(yǔ)法錯(cuò)誤和不通順的句子。如果應(yīng)用在AI同傳中，也可以在演講者的句子完成前以更快的速度進(jìn)行翻譯。

百度也推出了一種名為“wait－k words”的技術(shù)，即等待講話時(shí)后的第k個(gè)詞開(kāi)始翻譯，通過(guò)對(duì)講話者的語(yǔ)言風(fēng)格數(shù)據(jù)進(jìn)行訓(xùn)練，實(shí)現(xiàn)預(yù)測(cè)能力。同時(shí)還可以根據(jù)不同語(yǔ)種之間的差異性和不同場(chǎng)景的需求程度來(lái)調(diào)整K值，比如西班牙語(yǔ)和葡萄牙語(yǔ)在語(yǔ)法上非常接近，K值就可以被調(diào)整為1或者2，極大的提高及時(shí)性�；蛘弋�(dāng)使用者位于非常嚴(yán)肅的政治會(huì)議場(chǎng)合，K值就可以被調(diào)整為5或者更高，因此來(lái)保證嚴(yán)謹(jǐn)性。

去年谷歌推出的Transformer則是一個(gè)基于自注意力機(jī)制的全新神經(jīng)網(wǎng)絡(luò)架構(gòu)，也是忽略單詞在句子中的先后位置，而句子中所有單詞之間的關(guān)系直接進(jìn)行建模。所以一個(gè)單詞先出現(xiàn)還是后出現(xiàn)，對(duì)于自然語(yǔ)言處理來(lái)說(shuō)影響開(kāi)始沒(méi)那么大了。

總之，這些模仿人類(lèi)處理問(wèn)題方式的技術(shù)突破才是真的“人機(jī)耦合”。

想捧起圣杯，AI同傳應(yīng)該避免獨(dú)行

當(dāng)然，即便如此，AI同傳還是面臨著很多問(wèn)題。

尤其是人在口語(yǔ)表述時(shí)往往會(huì)帶有一些習(xí)慣性的語(yǔ)氣詞，AI如果通通記錄下來(lái)，會(huì)嚴(yán)重影響信息接收的效率。就像曾經(jīng)有人嘗試過(guò)在法庭使用AI速記，結(jié)果發(fā)現(xiàn)AI記下了通篇的“嗯、呃、那個(gè)”等等口語(yǔ)中的常用詞，尤其是當(dāng)出庭人情緒稍有些激動(dòng)時(shí)，AI速記完美的記錄下一串語(yǔ)無(wú)倫次時(shí)的混亂信息。信息量倒是加大了，可信息價(jià)值卻很低。

人類(lèi)譯員在進(jìn)行翻譯時(shí)會(huì)進(jìn)行書(shū)面語(yǔ)和口語(yǔ)之間的轉(zhuǎn)換，AI能否做到這種信息的匯總和提煉？

同時(shí)口語(yǔ)中常常遇到的口音、結(jié)巴、地方俚語(yǔ)、表述水平不同等等個(gè)性化的問(wèn)題，人類(lèi)譯員通�？梢院芎玫慕鉀Q，最終呈現(xiàn)出適用于所有人閱讀的內(nèi)容。就拿俚語(yǔ)來(lái)講，這種極具本土文化特征的內(nèi)容，有時(shí)會(huì)在兩個(gè)語(yǔ)種中呈現(xiàn)出完全不同的形態(tài)。就像“掌上明珠”和“Apple of the eye”，從字面直譯上很難找到關(guān)聯(lián)，可意義上卻相互對(duì)應(yīng)。

AI模型能否高效的解決一切問(wèn)題，不只適用于某一標(biāo)準(zhǔn)或某一種文化下的內(nèi)容？

最重要的，大部分像“wait－k words”這樣的預(yù)測(cè)模型都要提前進(jìn)行大量的數(shù)據(jù)訓(xùn)練。不光應(yīng)用成本高，對(duì)于很多缺乏豐富數(shù)據(jù)的小眾語(yǔ)種來(lái)說(shuō)，還是幫不上什么忙。

不過(guò)相比人類(lèi)在同聲傳譯整個(gè)學(xué)習(xí)和翻譯過(guò)程中耗費(fèi)的巨大精力，AI同傳更高效的學(xué)習(xí)能力和永不疲倦的特點(diǎn)仍然是巨大的優(yōu)勢(shì)。所以在未來(lái)的一段時(shí)間內(nèi)，AI同傳應(yīng)該依靠自身優(yōu)勢(shì)來(lái)承擔(dān)人類(lèi)譯員助手的職責(zé)，與人類(lèi)一同捧起圣杯。這才是理想狀態(tài)下的人機(jī)耦合。

機(jī)器思維與人類(lèi)思維的打通：AI應(yīng)用的黃金大門(mén)

其實(shí)我們能夠發(fā)現(xiàn)，現(xiàn)在機(jī)器同傳解決方案的發(fā)展方向，體現(xiàn)出了一種AI技術(shù)應(yīng)用的有趣邏輯，即把機(jī)器思維和人類(lèi)思維一起融入技術(shù)應(yīng)用。

像在提升語(yǔ)音容錯(cuò)率上，就是一種典型的機(jī)器思維。如果把解決問(wèn)題分兩步，第一步是語(yǔ)音－文字，第二步是文字－翻譯。數(shù)學(xué)老師一定會(huì)告訴你“一步錯(cuò)、步步錯(cuò)”，可在機(jī)器思維中卻能實(shí)現(xiàn)“一步錯(cuò)、結(jié)果對(duì)”，即使語(yǔ)音識(shí)別中錯(cuò)了，機(jī)器翻譯的結(jié)果仍然是正確的。

而在預(yù)測(cè)方面，就是典型的人類(lèi)思維了，結(jié)合對(duì)于事物的整體理解甚至整個(gè)世界觀，對(duì)于缺失的信息進(jìn)行預(yù)測(cè)——用我們?nèi)祟?lèi)的話說(shuō)，就是“直覺(jué)”。而當(dāng)機(jī)器也逐漸找到利用直覺(jué)的方式，它們所能解決的問(wèn)題才更邁上了一個(gè)臺(tái)階。有了預(yù)測(cè)能力，才能在不同語(yǔ)序的語(yǔ)種中自我生成正確的句子。畢竟我們所處的世界不是棋盤(pán)也不是電子游戲，缺乏明確的規(guī)則，更多時(shí)候我們是在信息和規(guī)則雙雙不透明的前提下去解決問(wèn)題。

其實(shí)在今天的AI應(yīng)用上，最重要的就是人與AI的協(xié)作性，不僅僅是日常應(yīng)用方面的協(xié)作，更多的是研發(fā)思維上的協(xié)作。有時(shí)能理解機(jī)器思維的差異性，才能真正找到適合機(jī)器的問(wèn)題解決方案，而讓機(jī)器能夠?qū)W會(huì)人類(lèi)思維，才能讓機(jī)器解決問(wèn)題的方式更加配適現(xiàn)實(shí)世界。

就像自動(dòng)駕駛的安全問(wèn)題一樣，有時(shí)在交通標(biāo)識(shí)上貼一張小小的貼紙，就能徹底擾亂機(jī)器的視覺(jué)系統(tǒng)。所以對(duì)于自動(dòng)駕駛來(lái)說(shuō)，更高效和安全的方法并不是像人類(lèi)一樣“看到”交通標(biāo)識(shí)，而是在高精地圖上提前標(biāo)注好交通標(biāo)識(shí)的位置。對(duì)人類(lèi)與機(jī)器的感知方式進(jìn)行互通和融合，幫助我們打開(kāi)了很多AI產(chǎn)業(yè)應(yīng)用的黃金大門(mén)。

有趣的是，這兩種思維之間的差異和融合，其實(shí)和語(yǔ)言之間的翻譯還有點(diǎn)接近。語(yǔ)法有再多差異，彼此理解了，總能一起解決問(wèn)題。人機(jī)耦合，指的絕不僅僅是人類(lèi)與AI有著多么明確的分工，AI生產(chǎn)、人類(lèi)包裝這種行為在幾十年前就已經(jīng)出現(xiàn)并且沿用至今了，絕不是什么值得宣揚(yáng)的事。兩種思維的交互，才能稱(chēng)之為真正的“耦合”。

本地收藏打印推薦給朋友

聲明： 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載，目的在于信息傳遞，并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)，如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的，請(qǐng)聯(lián)系我們。