百度新出同傳AI,DEMO效果驚人,是噱頭還是實(shí)力?
同聲傳譯自1919年在巴黎和會(huì)上最早一次亮相后,一直在會(huì)議語(yǔ)言排障和實(shí)時(shí)溝通上發(fā)揮著至關(guān)重要的作用。同傳不同于其他翻譯,這種異常消耗腦力的工作不僅需要工作者雙語(yǔ)運(yùn)用自如的語(yǔ)言功底,還需要隨機(jī)應(yīng)變的能力。要達(dá)到同傳的高級(jí)翻譯水平,更是需要漫長(zhǎng)的修煉過(guò)程。正是因人才的極度稀缺,早就讓同聲傳譯被冠以“日進(jìn)斗金”的稱(chēng)號(hào)。
人工智能技術(shù)的發(fā)展雖然在各個(gè)方面改善了人們的生活,但同時(shí),它也帶來(lái)了一些現(xiàn)實(shí)存在的威脅,即去人力化并導(dǎo)致群體性失業(yè)。如今就連站在人才頂端的同聲傳譯行業(yè)也面臨著被替代的危險(xiǎn)。
但AI同傳工作要求高度的實(shí)時(shí)性、專(zhuān)業(yè)度,以及更低的容錯(cuò)率,因此在機(jī)器翻譯領(lǐng)域算是個(gè)艱難的任務(wù),甚至有人稱(chēng)之為機(jī)器翻譯的“圣杯”。即是圣杯,勝者必將贏得一片天地,因此除了孜孜不倦的獨(dú)角獸,微軟、百度、谷歌等海內(nèi)外的AI大廠也都在不斷攻克這項(xiàng)難題,然而各方成果卻有喜有憂。
眾人競(jìng)捧AI同傳圣杯,噱頭還是實(shí)力?
去年,具有世界領(lǐng)先翻譯技術(shù)的科大訊飛發(fā)布的曉譯翻譯機(jī)獲得了超高的人氣,其卓越的表現(xiàn)甚至被認(rèn)為是取代同聲傳譯的一款人工智能產(chǎn)品。然而好景不長(zhǎng),前段時(shí)間,爆出的“科大訊飛造假事件”掀起了一場(chǎng)軒然大波,雖科大訊飛方面再三強(qiáng)調(diào)“人機(jī)耦合”而非AI同傳,但其偷換概念,避重就輕的做法還是令一些人對(duì)AI同傳產(chǎn)生消極的看法,一時(shí)間唱衰AI同傳突然鵲起。然而因此全盤(pán)否定AI在同傳上的成就和能力,就有點(diǎn)以偏概全了。
其實(shí),訊飛造假事件中,核心問(wèn)題甚至不在于AI同傳的技術(shù)能力,而是它根本沒(méi)有使用AI同傳。事實(shí)上,該會(huì)議僅僅使用了“訊飛聽(tīng)見(jiàn)”產(chǎn)品,實(shí)際使用的僅僅是語(yǔ)音轉(zhuǎn)換文本功能而已。
搜狗同傳憑實(shí)力為AI同傳正聲
然而科大訊飛的造假事件并非代表著AI同傳真的涼了,真正的AI同傳也并非不存在。相反,今天越來(lái)越多國(guó)際會(huì)議和新聞發(fā)布會(huì)、體育賽事等等重要場(chǎng)合開(kāi)始使用AI同傳。
前段時(shí)間,搜狗同傳作為中國(guó)網(wǎng)球公開(kāi)賽的官方翻譯合作伙伴,從賽前的媒體發(fā)布會(huì)到賽后采訪,對(duì)獲勝球員的發(fā)言交流提供實(shí)時(shí)翻譯,這是AI同傳首次支持大型國(guó)際體育賽事。雖然依然有諸多技術(shù)不完美之處,但進(jìn)步顯著,并且是AI同傳證明其實(shí)力的一次重要展現(xiàn)。
搜狗同傳采用的是端對(duì)端神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),可以使用循環(huán)神經(jīng)網(wǎng)絡(luò)生成翻譯結(jié)果,并將神經(jīng)網(wǎng)絡(luò)精簡(jiǎn)為五層,翻譯的結(jié)果相比傳統(tǒng)機(jī)器翻譯大約能高出30%-40%,效率也大幅提升;其使用的語(yǔ)音斷句算法,能很好地識(shí)別詞語(yǔ)和句子的停頓,輸送出更符合人類(lèi)語(yǔ)言習(xí)慣的翻譯結(jié)果,這也是搜狗同傳能夠快速超車(chē),為AI同傳正聲的實(shí)力所在。
百度新推AI同傳,DEMO效果驚人,可期
近日,百度于硅谷宣布了最新重大突破——一個(gè)名為STACL的同傳AI,論文結(jié)果優(yōu)異,Demo效果驚人,MIT科技評(píng)論、IEEE Spectrum等一眾外媒紛紛好評(píng),這是自2016年百度Deep Speech 2發(fā)布以來(lái),又一項(xiàng)讓技術(shù)外媒們?nèi)绱思?dòng)的新進(jìn)展。
據(jù)百度方透露,與現(xiàn)在大多數(shù)AI“實(shí)時(shí)”翻譯系統(tǒng)不同,STACL具備可預(yù)測(cè)和延時(shí)可控的特點(diǎn),不走“整句說(shuō)完再翻譯”的路線,能夠在演講者講話后幾秒鐘開(kāi)始翻譯,并在句子結(jié)束后幾秒鐘內(nèi)完成。那么百度又是如何做到高質(zhì)量與短延時(shí)兼具的呢?
同音近音字問(wèn)題
如何分辨同音近音字是保證同傳準(zhǔn)確性的一個(gè)關(guān)鍵點(diǎn),需要根據(jù)語(yǔ)境和背景知識(shí)共同分析的過(guò)程。在這方面,百度采取了提升容錯(cuò)率,忽略語(yǔ)音-文字轉(zhuǎn)碼階段的錯(cuò)誤,進(jìn)而去提升文字翻譯階段的正確率的方案。百度同傳的“語(yǔ)音容錯(cuò)”的對(duì)抗訓(xùn)練翻譯模型,重點(diǎn)就在于有意在訓(xùn)練數(shù)據(jù)集中加入針對(duì)性的噪聲數(shù)據(jù),這樣即使模型接受到錯(cuò)誤的語(yǔ)音識(shí)別結(jié)果時(shí),也能給出正確的譯文。
預(yù)測(cè)能力
這次百度推出AI同傳的重點(diǎn)技術(shù)為STACL“wait-k words”,即等待講話時(shí)后的第k個(gè)詞開(kāi)始翻譯,通過(guò)對(duì)講話者的語(yǔ)言風(fēng)格數(shù)據(jù)進(jìn)行訓(xùn)練,實(shí)現(xiàn)預(yù)測(cè)能力。同時(shí)還可以根據(jù)不同語(yǔ)種之間的差異性和不同場(chǎng)景的需求程度來(lái)調(diào)整K值。
機(jī)器學(xué)習(xí)
在百度同傳系統(tǒng)中,提出了快速融合領(lǐng)域知識(shí)策略,建立在百度自身的互聯(lián)網(wǎng)大數(shù)據(jù)之上,百度同傳系統(tǒng)獲得最基礎(chǔ)的通用領(lǐng)域翻譯模型。而當(dāng)進(jìn)入細(xì)分領(lǐng)域時(shí),該系統(tǒng)也會(huì)像人類(lèi)一樣,針對(duì)細(xì)分領(lǐng)域進(jìn)行學(xué)習(xí)。
建立在通用模型的基礎(chǔ)上,通過(guò)對(duì)某一領(lǐng)域數(shù)據(jù)的增強(qiáng)訓(xùn)練和專(zhuān)用術(shù)語(yǔ)的強(qiáng)制解碼,盡可能讓整體模型和該領(lǐng)域更加契合,從而減少同音字、多義字翻譯錯(cuò)誤等諸如此類(lèi)現(xiàn)象,提升整體效率。
由此可見(jiàn),百度新出的AI同傳技術(shù)并非夸大宣傳,而是有技術(shù)支撐的實(shí)力展現(xiàn)。
對(duì)于百度此次在AI同傳上的大動(dòng)作,Engadget認(rèn)為:“雖然這個(gè)系統(tǒng)仍舊有局限性,而且無(wú)法在必要的時(shí)候取代人類(lèi)翻譯。但是它在谷歌缺席中國(guó)的情況下,給出了一種新的選擇!
AI同傳是一個(gè)復(fù)雜的工作過(guò)程,其在表現(xiàn)上的細(xì)微差距,背后都隱藏著從機(jī)器翻譯技術(shù)集成、神經(jīng)網(wǎng)絡(luò)系統(tǒng),到NLP等多種技術(shù)能力的集合。一家公司復(fù)雜龐大AI+語(yǔ)言領(lǐng)域技術(shù)體系,最終將會(huì)在終端產(chǎn)品表現(xiàn)。正是語(yǔ)音識(shí)別、機(jī)器翻譯等領(lǐng)域上的深厚積累,千錘百煉之下造就了能聽(tīng)會(huì)說(shuō)、能理解會(huì)思考的AI同傳。最終能捧得AI同傳這座圣杯的,拼的不是噱頭,不是夸大宣傳,而是實(shí)打?qū)嵉募夹g(shù)體系。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專(zhuān)題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?