- 簡體中文
- 繁體中文
- English
- Japanese
- Korean
- Russian
- French
- Spanish
互聯(lián)網(wǎng)的飛速發(fā)展極大地豐富了翻譯方式,帶動了全球翻譯市場的繁榮。為了節(jié)約成本,提高翻譯效率,譯員紛紛借助于現(xiàn)代網(wǎng)絡(luò)技術(shù)及工具來輔助完成翻譯任務(wù),出現(xiàn)了眾多新穎的翻譯方式。其中尤其以MT(Machine Translation,機器翻譯)和CAT(Computer - Aided Translation,計算機輔助翻譯)兩種翻譯方式使用最廣、接受度最高。有鑒于此,文章詳細(xì)描述這兩種翻譯方式的發(fā)展演變及工作原理,指出其異同及優(yōu)缺點,從而幫助譯員在翻譯實踐中選擇適合自己的翻譯方式。
一、兩種主要翻譯方式概述
(一)機器翻譯概述
機器翻譯,顧名思義就是指通過機器將一種語言形式自動轉(zhuǎn)換為另一種語言形式的過程。在整個語言轉(zhuǎn)換過程中,機器始終是語言轉(zhuǎn)換的直接參與者或參與主體,是譯文生成的核心形式。
根據(jù)不同發(fā)展階段所呈現(xiàn)出的不同特征,機器翻譯主要可以劃分為基于語言規(guī)則的翻譯和基于語料庫的翻譯兩種形式,其翻譯特點及具體流程如下所述。
1.基于語言規(guī)則的機器翻譯
任何一種語言都有自己獨特的諸如語音、詞匯、句法、語義等系統(tǒng)。在這些系統(tǒng)的協(xié)調(diào)作用下,語言的交流功能得以成功實現(xiàn)。20 世紀(jì)后半期,隨著計算機技術(shù)和現(xiàn)代語言學(xué)特別是喬姆斯基的轉(zhuǎn)換生成語法理論的日益發(fā)展,語言學(xué)家開始嘗試著將語言學(xué)與計算機技術(shù)相結(jié)合,編制出一套公式化、規(guī)則化的語言結(jié)構(gòu)模型,嘗試著用規(guī)則去描述語言進(jìn)而翻譯語言以實現(xiàn)不同語言間的轉(zhuǎn)換,即基于語言規(guī)則的機器翻譯。
基于語言規(guī)則的機器翻譯的工作原理為:計算機軟件將輸入的原語文本通過詞法、句法、語法、語義等分析轉(zhuǎn)換生成為計算機系統(tǒng)內(nèi)儲存的中間語言結(jié)構(gòu)模型,再經(jīng)由中間語言結(jié)構(gòu)模型轉(zhuǎn)換生成為另一種語言即目標(biāo)語言,從而實現(xiàn)不同語言間的近乎等值的轉(zhuǎn)換。這類機器翻譯主要集中在詞典類查閱翻譯軟件方面。代表性的以雙語詞典類軟件為主,主要有:金山詞霸、巴比倫翻譯家、金山快譯、東方快車、南極星、通譯、雅信譯霸等等。
2.基于語料庫的機器翻譯
互聯(lián)網(wǎng)技術(shù)的日趨普及以及全球國家間經(jīng)濟與文化交流的深入,為了促進(jìn)行業(yè)間專業(yè)化國際化交流,大量不同領(lǐng)域?qū)I(yè)文獻(xiàn)資料亟待翻譯,為了系統(tǒng)高效地完成翻譯任務(wù),諸如機械、電子商務(wù)、法律、汽車制造、生物醫(yī)學(xué)等不同領(lǐng)域不同行業(yè)的雙語或多語種語料庫應(yīng)運而生。海量的資源以語料庫的形式被保存于互聯(lián)網(wǎng)平臺供譯員使用,尤其是一些專業(yè)化程度高、普及度廣的雙語平行語料庫,更為不同語言間的轉(zhuǎn)換提供了便利。
雙語平行語料庫基于 SGML標(biāo)記語言對采集到的流通中的真實動態(tài)語料通過 TEI 和 CES 文本編碼,以詞、短語及句子為單位進(jìn)行自動對齊排列,譯員實際翻譯中對有疑問或不懂的地方,只需打開相關(guān)的語料庫平臺直接輸人原語文本中的詞頻或句頻進(jìn)行搜索,就會得到基于統(tǒng)計和實例的鮮活目標(biāo)語文本語料,極大地提高了翻譯效率,成為翻譯過程中的“機器譯員”。國內(nèi)外知名的語料庫主要有:北京大學(xué)中國語言學(xué)研究中心開發(fā)研制的“漢英雙語語料庫”、北京語言大學(xué)高翻學(xué)院開發(fā)研制的“高翻記憶庫”、上海交通大學(xué)語言工程研究所的四個語料庫、國家語言文字應(yīng)用研究所開發(fā)研制的“計算機專業(yè)雙語語料庫”等。一些基于網(wǎng)絡(luò)平臺的在線翻譯工具諸如 Google 在線翻譯、百度在線翻譯等正是利用網(wǎng)絡(luò)大數(shù)據(jù)語料庫平臺,為廣大譯員提供質(zhì)量上乘而又便捷高效的翻譯,在眾多基于網(wǎng)絡(luò)語料庫的機器翻譯工具中脫穎而出。
機器翻譯無論是基于語言規(guī)則還是基于語料庫的翻譯形式,其翻譯過程都可以歸納為分解、轉(zhuǎn)換及合成三個步驟。分解階段,系統(tǒng)根據(jù)提交的原語詞匯或句子,檢索匹配系統(tǒng)中儲存的語言結(jié)構(gòu)模型或?qū)嵗纬稍Z匹配表達(dá);轉(zhuǎn)換階段,機器根據(jù)系統(tǒng)中的對齊功能將原語匹配表達(dá)轉(zhuǎn)換成目標(biāo)語匹配表達(dá);合成階段,將目標(biāo)匹配表達(dá)融合到目標(biāo)語全文文本中,輸出目標(biāo)譯文。
(二)計算機輔助翻譯概述
機器翻譯較于人工翻譯費時低效帶來了翻譯效率的極大提升,但是由于其糟糕的翻譯質(zhì)量,到了20 世紀(jì)80年代進(jìn)入了“反思的理性階段”。德國翻譯理論家認(rèn)為技術(shù)的產(chǎn)物,無論怎么復(fù)雜,都不能和人腦的創(chuàng)造能力相媲美。20 世紀(jì) 80 年代末,隨著計算機技術(shù)革命浪潮的蓬勃發(fā)展以及網(wǎng)絡(luò)平臺大數(shù)據(jù)資源庫的日益完善,一種新型的基于記憶庫和術(shù)語庫的計算機輔助翻譯形式應(yīng)運而生。廣義的計算機輔助翻譯概念是指,能夠輔助譯員進(jìn)行翻譯的所有計算機工具,包括文字處理軟件、語法檢查工具、電子郵件和互聯(lián)網(wǎng)等。也就是上文所提到的機器翻譯。狹義的計算機輔助翻譯概念是指“為提高翻譯效率,優(yōu)化翻譯流程而設(shè)計的專門的計算機輔助翻譯軟件”。主要包含翻譯記憶工具、術(shù)語管理工具等。其中以中國的雅信 CAT、法國的 DejaVu、德國的 Trados 等為典型的代表。
1.翻譯術(shù)語庫模塊及其功能
術(shù)語庫管理模塊,可以轉(zhuǎn)換、編輯及生成項目術(shù)語庫。確保譯文術(shù)語前后的統(tǒng)一性。通過譯前導(dǎo)入客戶所提供的術(shù)語資料或譯前翻譯公司及譯員整理的術(shù)語資料,系統(tǒng)將導(dǎo)入的術(shù)語信息編輯并自動保存到后臺術(shù)語庫,在后面的翻譯過程中系統(tǒng)自動從后臺調(diào)取供譯員使用。
2.翻譯記憶庫模塊及其功能
翻譯記憶模塊作為計算機輔助翻譯軟件的核心模塊,是“譯者運用計算機程序部分參與翻譯過程的一種翻譯策略”。其工作的原理是:“譯員利用已有的原文和譯文,建立起一個或多個翻譯記憶庫,在翻譯過程中,系統(tǒng)將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如短語、句子、段落等),然后給出參考譯文供譯員選擇,對于給出的參考譯文,譯員可以完全照搬,也可以修改后使用,如果覺得不滿意,還可以棄之不用。這樣譯員就可以避免無謂的重復(fù)勞動,專注于新內(nèi)容的翻譯。而翻譯記憶庫司時在后臺不斷學(xué)習(xí)并自動儲存新的譯文,變得越來越聰明,效率越來越高。”
二、兩種翻譯方式的比較及翻譯選擇
機器翻譯與計算機輔助翻譯兩者既有聯(lián)系又有區(qū)別,不能混為一談。機器翻譯是計算機程序自動參與翻譯全過程并直接生成目標(biāo)譯文;而計算機輔助翻譯,程序本身并不直接參與翻譯,并不能直接生成目標(biāo)譯文,只是輔助人工提高效率。機器翻譯與計算機輔助翻譯作為“互聯(lián)網(wǎng) +”時代影響較廣的兩種翻譯方式,各有其優(yōu)劣之處。譯員在翻譯時,應(yīng)根據(jù)所需,揚長避短、趨利避害,選擇適合自己的翻譯方式。兩者的優(yōu)劣分析如下。
(一)MT和 CAT的優(yōu)勢比較分析
不論是機器翻譯還是計算機輔助翻譯,較于之前的人工翻譯,速度快、成本低,都從根本上減輕了譯員的負(fù)擔(dān),提高了翻譯的效率。
機器翻譯由于系統(tǒng)自身儲存的數(shù)以萬計的詞匯、龐大的中間語言結(jié)構(gòu)模型庫及大量分門別類的多語種平行語料庫,可以快速地實現(xiàn)原語與目標(biāo)語之間的轉(zhuǎn)換,提高翻譯效率。
計算機輔助翻譯由于系統(tǒng)自身攜帶的術(shù)語庫與記憶庫,可以在翻譯進(jìn)行中自動為譯員從儲存庫中檢索匹配相似詞段及句段供譯員選擇使用,確保譯文前后表達(dá)的一致,減少了譯員單調(diào)重復(fù)的機械勞動。計算機輔助軟件本身還兼容市面上眾多格式的文本并生成與原語文本格式相同的目標(biāo)文本,省去了專門技術(shù)譯員進(jìn)行排版及格式轉(zhuǎn)換等工作,降低了翻譯的成本。符合翻譯流程管理本地化節(jié)省開支的要求,從而有效地提高了翻譯效率。同時這種以人工為主機器為輔的人機交互翻譯模式,集合人工與機器的優(yōu)點,在一定程度上避免了以機器為主體自動翻譯模式的弊端,進(jìn)一步提升了譯文的質(zhì)量。
(二)MT和CAT的劣勢比較分析
機器翻譯快速便捷,翻譯的前提是必須有大量的概率化的語言結(jié)構(gòu)模型及基于鮮活實例的語料庫供計算機系統(tǒng)進(jìn)行檢索匹配,從而進(jìn)行編碼解碼生成目標(biāo)譯文。語言結(jié)構(gòu)模型模擬人類真實語言規(guī)律,通過一定的規(guī)則來描述自然語言。盡管計算機具有儲存記憶等功能,但是人類自然語言具有靈活性、復(fù)雜性、變化性及開放性等特點,計算機需要識別原語的形態(tài),進(jìn)行形態(tài)分析、語義分析以及句法分析,這就使得中間語言結(jié)構(gòu)模型的構(gòu)建變得異常困難。王金銓認(rèn)為,翻譯過程不是一個簡單的語碼轉(zhuǎn)換過程,而是一個極其復(fù)雜的心理過程,是一個非線性的波浪式前進(jìn)的動態(tài)思維過程。尤其是隨著“互聯(lián)網(wǎng)+”大數(shù)據(jù)時代的到來,翻譯的信息量更加龐大,從而一定程度上進(jìn)一步加深了中間語言結(jié)構(gòu)模型構(gòu)建的難度。這就導(dǎo)致了基于語言規(guī)則的機器翻譯生成的所謂“草稿譯文”質(zhì)量令人憂慮。而基于語料庫的機器翻譯由于鮮活語料的幫助相對于基于語言規(guī)則的翻譯就相對容易許多,譯文的質(zhì)量更有保障。但是眾所眾知,平行語料庫的建構(gòu)不是一朝一夕一蹴而就的簡單事情,另外網(wǎng)絡(luò)數(shù)據(jù)平臺儲存的鮮活實例需要耗費大量的人力物力進(jìn)行篩選整理去粗取精去偽存真。
計算機輔助翻譯充分發(fā)揮人工的主體性及能動性以及機器的存儲性與記憶性的特點,在語料庫機器翻譯的基礎(chǔ)上又往前推進(jìn)了一步。但是作為計輔翻譯的核心組件,術(shù)語庫與記憶庫的構(gòu)建同樣也任重道遠(yuǎn)。記憶庫的質(zhì)量控制、成本維護(hù)、開源與封閉、知識產(chǎn)權(quán)歸屬等也時刻制約著計算機輔助翻譯的廣泛與長遠(yuǎn)的發(fā)展。
翻譯活動的復(fù)雜性決定了譯員不可能僅單純地依靠某一種翻譯方式就能完成翻譯任務(wù),而是需要綜合使用多種翻譯方式,優(yōu)勢互補,揚長避短,共同作用于翻譯實踐。
隨著“互聯(lián)網(wǎng)+”大數(shù)據(jù)時代的不斷發(fā)展,需要翻譯的文獻(xiàn)資料數(shù)量日趨龐大,對翻譯方式的選擇也愈來愈頻繁,選擇什么樣的翻譯方式來進(jìn)行翻譯是每個譯員急需解決的問題。希望譯員在本文的幫助下,綜合考量所要使用翻譯方式的特點及所翻譯的源文本類型特點來選擇合適的翻譯方式,最大化發(fā)揮各種翻譯方式的優(yōu)勢,從而提高翻譯效率。
文章來源:網(wǎng)絡(luò)