訂閱
糾錯
加入自媒體

機器翻譯真的可以取代翻譯員的工作嗎?

我們生活常用的機器翻譯成為翻譯活動中的重要的輔助工具。而機器翻譯錯譯、死譯頻出,給翻譯工作帶來諸多不便。近年來,“大數(shù)據(jù)”的出現(xiàn)為機器翻譯帶來了新希望,其獨特的“4V”特點將對機器翻譯產(chǎn)生革命性的影響?贫啻髷(shù)據(jù)帶大家來看看大數(shù)據(jù)在機器翻譯中的應(yīng)用是怎么樣的。

大數(shù)據(jù),即大量的數(shù)據(jù),在一定程度上可以理解為多個大語料庫的結(jié)合體。維克托·邁爾提出大數(shù)據(jù)有容量大、種類多、速度快和價值高四大特征。容量大、種類多保證了它為譯者提供一個包含各種資源的巨型共享資料庫;速度快、價值高可提高翻譯的效率和精確度。譯者要意識到大數(shù)據(jù)共享資源的重要性,充分利用其來查找翻譯所需的相關(guān)資源。

大數(shù)據(jù)時代,利用信息技術(shù)進行輔助翻譯是翻譯工作者一項必備技能。經(jīng)濟全球化快速發(fā)展帶來各國交流頻繁,各種翻譯應(yīng)接不暇,利用信息技術(shù)進行輔助翻譯是大勢所趨。下面主要圍繞兩種輔助翻譯工具展開:塔多思與谷歌。

Trados是一種翻譯記憶軟件。它將譯員做過的工作用Trados提供的工具存儲起來,放到兩個主要的數(shù)據(jù)庫中:句料庫和術(shù)語庫。Trados基于數(shù)據(jù)庫原理,利用翻譯記憶,將已譯資源以句子為單位存入數(shù)據(jù)庫,翻譯時系統(tǒng)自動對源語言文本進行分析,與數(shù)據(jù)庫中的翻譯記憶進行匹配,100%匹配的句子可自動替換;部分匹配的句子根據(jù)匹配度提出翻譯建議;全新的句子可通過系統(tǒng)提供的建議進行人工翻譯;而每一次翻譯又作為新翻譯記憶積累入數(shù)據(jù)庫。這樣將機器與人工相結(jié)合就幫助譯者提高了翻譯效率和準(zhǔn)確性。Trados能夠自動替換日期、時間和度量單位等,如句料庫中有2008年5月,譯文中出現(xiàn)May,2017時就會自動替換為2017年5月。

谷歌翻譯使用的是基于統(tǒng)計的翻譯方法,所有語言知識都是從語料庫中自動獲取,通過概率模型對語料庫中的句子進行概率計算后生成。來自互聯(lián)網(wǎng)的幾乎所有語言文本,構(gòu)成了谷歌的龐大的語料庫。谷歌翻譯還利用網(wǎng)絡(luò)資源不斷補充和更新。所以在谷歌翻譯中輸入源語言文本后,系統(tǒng)會根據(jù)概率模型對語料庫中的句子進行概率計算搜索出最優(yōu)化和使用頻次最高的譯文,如輸入“Nopains,nogains.”,便會生成譯文“不勞則無獲。”

(一)優(yōu)勢

大數(shù)據(jù)時代,基于平行語料庫,翻譯多樣性和準(zhǔn)確性成為可能。語料庫幫助提供真實語料、提供統(tǒng)計數(shù)據(jù)、驗證現(xiàn)行的理論、構(gòu)建新的理論。例如,紅樓夢中前80回出現(xiàn)了1219個“某某笑道”,該如何翻譯呢?全譯為smiledandsaid,不僅重復(fù),而且抹去了經(jīng)典名作的文學(xué)特色。這時譯者可以借助大數(shù)據(jù)的優(yōu)勢,查詢smile的平行詞找到chuckle,giggle,grin等或通過網(wǎng)絡(luò)向英語母語朋友和高人請教,再根據(jù)人物特點和上下文選擇適當(dāng)譯文。使用翻譯記憶軟件可以讓眾多譯員共享網(wǎng)絡(luò)術(shù)語庫,避免重復(fù)工作,降低翻譯成本,節(jié)省時間和精力,保持上下文術(shù)語前后一致,從整體上提高了翻譯效率和質(zhì)量。而且谷歌本身作為搜索引擎,為其語料庫內(nèi)容的充實和更新提供了便利條件。

(二)局限

大數(shù)據(jù)時代下的機器翻譯給人們帶來了諸多便利,但也有其局限性。

一,譯文好壞受到平行語料庫數(shù)據(jù)大小和領(lǐng)域的制約。由于語言規(guī)則復(fù)雜,樣本信息必須足夠大才能有好的效果。

二,運用Trados進行翻譯時極大地依賴于翻譯記憶,若翻譯記憶資源中有誤,翻譯記憶的質(zhì)量和數(shù)量都會影響譯文準(zhǔn)確度。

三,基于大數(shù)據(jù)的翻譯方法并不涉及規(guī)則,尤其是語法規(guī)則,機器翻譯不能識別語法信息,降低了譯文的可理解度。如輸入Ahorsestumblesthathasfourlegs時,谷歌翻譯給出的譯文是“馬絆倒有四條腿”。

四,基于大數(shù)據(jù)的翻譯抑制了譯者的創(chuàng)新思維,譯者只會搜索而不是自己思考,或許會有更好的譯文也說不定。

五,在翻譯帶有情感的源語言時,機器并不能像人那樣發(fā)揮譯者的主體性,給出合適的最符合語境的翻譯,體現(xiàn)不出原文人物內(nèi)心的感情色彩,在描寫人物的心理變化方面明顯不足。

六,機器翻譯無法處理多義詞。輸入的源語言文本內(nèi)容并不一定能夠百分之百地在語料庫中匹配到對應(yīng)的內(nèi)容。

七,機器不能考慮源語言的文化背景上下文等,不能選擇最恰當(dāng)?shù)淖g法。

盡管已取得巨大進步,機器翻譯也有不足之處?傊,在大數(shù)據(jù)時代下,計算機翻譯工具只是一種輔助工具,最根本的還是要發(fā)揮譯員的主體性作用,在不斷改善翻譯記憶庫中所儲譯文質(zhì)量和數(shù)量情況下,機譯結(jié)合人譯,才能更好地做好翻譯工作。

相信大家都知道打鐵還需自身硬,我們要鞏固好自身的大數(shù)據(jù)技術(shù),才能更好的應(yīng)用在產(chǎn)品中并不斷的優(yōu)化完善,改善我們的生活。更多大數(shù)據(jù)與人工智能的相關(guān)學(xué)習(xí)資訊關(guān)注公眾號成都科多大數(shù)據(jù)即可免費獲取。

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號