機器翻譯真的可以取代翻譯員的工作嗎?
我們生活常用的機器翻譯成為翻譯活動中的重要的輔助工具。而機器翻譯錯譯、死譯頻出,給翻譯工作帶來諸多不便。近年來,“大數(shù)據(jù)”的出現(xiàn)為機器翻譯帶來了新希望,其獨特的“4V”特點將對機器翻譯產(chǎn)生革命性的影響?贫啻髷(shù)據(jù)帶大家來看看大數(shù)據(jù)在機器翻譯中的應(yīng)用是怎么樣的。
大數(shù)據(jù),即大量的數(shù)據(jù),在一定程度上可以理解為多個大語料庫的結(jié)合體。維克托·邁爾提出大數(shù)據(jù)有容量大、種類多、速度快和價值高四大特征。容量大、種類多保證了它為譯者提供一個包含各種資源的巨型共享資料庫;速度快、價值高可提高翻譯的效率和精確度。譯者要意識到大數(shù)據(jù)共享資源的重要性,充分利用其來查找翻譯所需的相關(guān)資源。
大數(shù)據(jù)時代,利用信息技術(shù)進行輔助翻譯是翻譯工作者一項必備技能。經(jīng)濟全球化快速發(fā)展帶來各國交流頻繁,各種翻譯應(yīng)接不暇,利用信息技術(shù)進行輔助翻譯是大勢所趨。下面主要圍繞兩種輔助翻譯工具展開:塔多思與谷歌。
Trados是一種翻譯記憶軟件。它將譯員做過的工作用Trados提供的工具存儲起來,放到兩個主要的數(shù)據(jù)庫中:句料庫和術(shù)語庫。Trados基于數(shù)據(jù)庫原理,利用翻譯記憶,將已譯資源以句子為單位存入數(shù)據(jù)庫,翻譯時系統(tǒng)自動對源語言文本進行分析,與數(shù)據(jù)庫中的翻譯記憶進行匹配,100%匹配的句子可自動替換;部分匹配的句子根據(jù)匹配度提出翻譯建議;全新的句子可通過系統(tǒng)提供的建議進行人工翻譯;而每一次翻譯又作為新翻譯記憶積累入數(shù)據(jù)庫。這樣將機器與人工相結(jié)合就幫助譯者提高了翻譯效率和準(zhǔn)確性。Trados能夠自動替換日期、時間和度量單位等,如句料庫中有2008年5月,譯文中出現(xiàn)May,2017時就會自動替換為2017年5月。
谷歌翻譯使用的是基于統(tǒng)計的翻譯方法,所有語言知識都是從語料庫中自動獲取,通過概率模型對語料庫中的句子進行概率計算后生成。來自互聯(lián)網(wǎng)的幾乎所有語言文本,構(gòu)成了谷歌的龐大的語料庫。谷歌翻譯還利用網(wǎng)絡(luò)資源不斷補充和更新。所以在谷歌翻譯中輸入源語言文本后,系統(tǒng)會根據(jù)概率模型對語料庫中的句子進行概率計算搜索出最優(yōu)化和使用頻次最高的譯文,如輸入“Nopains,nogains.”,便會生成譯文“不勞則無獲。”
(一)優(yōu)勢
大數(shù)據(jù)時代,基于平行語料庫,翻譯多樣性和準(zhǔn)確性成為可能。語料庫幫助提供真實語料、提供統(tǒng)計數(shù)據(jù)、驗證現(xiàn)行的理論、構(gòu)建新的理論。例如,紅樓夢中前80回出現(xiàn)了1219個“某某笑道”,該如何翻譯呢?全譯為smiledandsaid,不僅重復(fù),而且抹去了經(jīng)典名作的文學(xué)特色。這時譯者可以借助大數(shù)據(jù)的優(yōu)勢,查詢smile的平行詞找到chuckle,giggle,grin等或通過網(wǎng)絡(luò)向英語母語朋友和高人請教,再根據(jù)人物特點和上下文選擇適當(dāng)譯文。使用翻譯記憶軟件可以讓眾多譯員共享網(wǎng)絡(luò)術(shù)語庫,避免重復(fù)工作,降低翻譯成本,節(jié)省時間和精力,保持上下文術(shù)語前后一致,從整體上提高了翻譯效率和質(zhì)量。而且谷歌本身作為搜索引擎,為其語料庫內(nèi)容的充實和更新提供了便利條件。
(二)局限
大數(shù)據(jù)時代下的機器翻譯給人們帶來了諸多便利,但也有其局限性。
一,譯文好壞受到平行語料庫數(shù)據(jù)大小和領(lǐng)域的制約。由于語言規(guī)則復(fù)雜,樣本信息必須足夠大才能有好的效果。
二,運用Trados進行翻譯時極大地依賴于翻譯記憶,若翻譯記憶資源中有誤,翻譯記憶的質(zhì)量和數(shù)量都會影響譯文準(zhǔn)確度。
三,基于大數(shù)據(jù)的翻譯方法并不涉及規(guī)則,尤其是語法規(guī)則,機器翻譯不能識別語法信息,降低了譯文的可理解度。如輸入Ahorsestumblesthathasfourlegs時,谷歌翻譯給出的譯文是“馬絆倒有四條腿”。
四,基于大數(shù)據(jù)的翻譯抑制了譯者的創(chuàng)新思維,譯者只會搜索而不是自己思考,或許會有更好的譯文也說不定。
五,在翻譯帶有情感的源語言時,機器并不能像人那樣發(fā)揮譯者的主體性,給出合適的最符合語境的翻譯,體現(xiàn)不出原文人物內(nèi)心的感情色彩,在描寫人物的心理變化方面明顯不足。
六,機器翻譯無法處理多義詞。輸入的源語言文本內(nèi)容并不一定能夠百分之百地在語料庫中匹配到對應(yīng)的內(nèi)容。
七,機器不能考慮源語言的文化背景上下文等,不能選擇最恰當(dāng)?shù)淖g法。
盡管已取得巨大進步,機器翻譯也有不足之處?傊,在大數(shù)據(jù)時代下,計算機翻譯工具只是一種輔助工具,最根本的還是要發(fā)揮譯員的主體性作用,在不斷改善翻譯記憶庫中所儲譯文質(zhì)量和數(shù)量情況下,機譯結(jié)合人譯,才能更好地做好翻譯工作。
相信大家都知道打鐵還需自身硬,我們要鞏固好自身的大數(shù)據(jù)技術(shù),才能更好的應(yīng)用在產(chǎn)品中并不斷的優(yōu)化完善,改善我們的生活。更多大數(shù)據(jù)與人工智能的相關(guān)學(xué)習(xí)資訊關(guān)注公眾號成都科多大數(shù)據(jù)即可免費獲取。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?