計算機輔助翻譯的學習不能局限于某一個計算機輔助翻譯軟件的操作,而應傾向于“知識側重論”,傾向于理解該軟件設計的脈絡和原理,對軟件設計背后的基本概念和基本原則的理解,是計算機輔助翻譯學習的基本要求。
《計算機輔助翻譯基礎》分為基礎知識、翻譯與信息科學、文檔格式處理的自動化、術語管理與翻譯、翻譯記憶庫、翻譯記憶庫等章節(jié),旨在能讓讀者提供高效的、高質量的翻譯服務。
《論語·衛(wèi)靈公》中有云:“工欲善其事,必先利其器”。這句話為人們所熟知,其道理也很簡單:要想把事情做好,工具必須好使,如此才能事半功倍。計算機輔助翻譯的出現(xiàn)、發(fā)展和流行,與“工欲善其事,必先利其器”的思想是一脈相承的。計算機輔助翻譯學習和研究的主要目標,就是借助信息技術來優(yōu)化人工翻譯過程,以提供更好、更快的翻譯服務。無論是翻譯專業(yè)(或語言專業(yè))的學生,還是翻譯工作者,提供高效、優(yōu)質的翻譯服務是他們的共同愿望,當然也深知“工欲善其事,必先利其器”的道理。由是,經過業(yè)界諸多專家、學者近十年的倡導和推廣,熟悉計算機輔助翻譯技術的人員越來越多,計算機輔助翻譯技術應用領域也越來越廣,這是一個可喜的現(xiàn)象。
然而也應該看到,計算機輔助翻譯技術的推廣面臨越來越大的阻力。這種阻力來自于兩個方面。首要的方面是機器翻譯的高速發(fā)展。基于深度學習的機器翻譯技術在過去幾年里發(fā)展迅猛。一些研究表明,在一些特定的領域(如新聞)中,機器翻譯的譯文水平已經達到甚至超過了人工翻譯。由此而產生的疑問是:如果機器已經可以完成翻譯任務,翻譯過程不再需要人的參與,自然也就不再需要計算機輔助的人工翻譯,那么還有必要學習計算機輔助翻譯工具嗎?
另一方面的阻力是計算機輔助翻譯學習的難度。雖然計算機輔助翻譯已經為越來越多的人所知曉,然而其仍然是一個陌生且令人望而卻步的領域,如山上云霧中的亭臺樓閣,依稀可見,卻難以看得清楚,難以真正了解。導致這一現(xiàn)象的原因有很多。其中主要的原因是這一領域的學習內容、學習方法與語言學習的課程大相徑庭。語言學習課程包括各種語言技能訓練課程、文化知識課程、語言文學理論課程等,強調記憶、聯(lián)想、宏觀理論推導和思辨。然而,計算機輔助翻譯是信息技術和工具的運用,側重翻譯過程中問題的解決。這些問題,如標點符號的準確使用、格式的標準化、術語翻譯的一致性、翻譯記憶庫的制作等,大多具體、瑣碎、相互關聯(lián)。因此,語言課程中的各種學習方法難以有效遷移到計算機輔助翻譯的學習之中。另一個重要原因是,對于大多數(shù)語言專業(yè)的學生而言,計算機的運作如同黑匣子一般。計算機輔助翻譯涉及各種信息技術專業(yè)知識,如文字編碼、文件格式與轉換、數(shù)據(jù)庫操作、軟件界面交互,甚至算法等,計算機操作中嚴謹?shù)倪壿嬐评、煩瑣的操作步驟以及復雜的參數(shù)設置都令人無所適從。
如上所述,一方面,技術的發(fā)展使得計算機輔助翻譯技術的學習看起來似乎已經不再需要;另一方面.計算機輔助翻譯技術難以掌握。那么,為什么還需要學習計算機輔助翻譯技術呢?我們認為,上述對計算機輔助翻譯技術及其應用的理解是不全面的。當前基于深度學習的機器翻譯技術,如同其他基于深度學習的人工智能技術一樣,必須滿足豐富數(shù)據(jù)和知識、完全信息、確定性信息、靜態(tài)、單領域和單任務的要求。機器翻譯的成功依賴于超大規(guī)模的平行語料庫數(shù)據(jù),其性能也受到單一領域的局限,難以跨領域移植。更為重要的是,語言作為人類的交際工具,具有明顯的創(chuàng)造性、動態(tài)性和不確定性特征。這些特征都是當前基于深度學習的人工智能技術無法解決的。從這個角度看,機器翻譯的應用必然受到數(shù)據(jù)規(guī)模、語言動態(tài)性和創(chuàng)造性的局限。高級別的人工翻譯具有其不可替代性。翻譯行業(yè)仍然需要依賴于人工翻譯提供服務,機器翻譯也需要依賴于人工翻譯提供數(shù)據(jù)。
此外,計算機輔助翻譯技術與機器翻譯技術兩者并非兩種“井水不犯河水”的技術。相反,許多計算機輔助翻譯技術都是以機器翻譯技術為基礎,兩者在本質上都是自然語言處理技術的應用。如同機器翻譯一樣,計算機輔助翻譯的最主要應用,就是拓展翻譯工作者的信息處理能力,提高翻譯服務的質量和效率。譯后編輯模式的發(fā)展,就是結合計算機輔助翻譯技術與機器翻譯技術,應對不同場景需求,提升翻譯效率和質量的例證。
因此,我們認為,在人工智能快速發(fā)展的時代,計算機輔助翻譯技術的學習不是沒有必要了,反而是變得更為重要、更為緊迫了。機器翻譯技術的進步對翻譯工作人員提出了更高的要求。面對機器翻譯的挑戰(zhàn),翻譯工作者應積極了解機器翻譯和自然語言處理技術,積極將相關技術應用于翻譯實踐,運用相關技術拓展自身的信息處理能力,如此才有可能立于不敗之地。
唐旭日,博士,華中科技大學外語學院翻譯系主任,副教授。研究方向為計算語言學,涉及命名實體識別、隱喻計算、詞義演化計算、構式聚類、語義韻、計算機輔助翻譯等。主持國家社科基金研究項目一項,教育部自主創(chuàng)新項目一項,校級自主創(chuàng)新及湖北省教育廳社科項目多項,并作為主要成員參與國家863高新技術、國家自然科學基金以及國家社科基金等多項重量課題,在World Wide Web、International Journal of Corpus Linguistics、Natural Language Engineering、 Corpus Linguistics and Linguistic Theory、《武漢大學學報(信息科學版)》、《中文信息學報》、《當代語言學》、COLING等非常不錯刊物和學術會議上發(fā)表論文20多篇,出版教材一部。
第一章 基礎知識
1.1 字符編碼
1.1.1 ASCII編碼
1.1.2 漢字編碼
1.1.3 Unicode編碼
1.1.4 UTF-8編碼
1.2 自然語言處理技術
1.2.1 語言及其定義
1.2.2 自然語言處理技術
第二章 翻譯與信息科學
2.1 傳統(tǒng)翻譯過程及其局限性
2.1.1 微觀層面的局限性
2.1.2 宏觀層面的局限性
2.2 信息技術與翻譯
2.2.1 信息技術與翻譯主體
2.2.2 信息技術與翻譯過程
2.2.3 信息技術與翻譯效率提升
2.3 歷史與未來
2.3.1 計算機輔助翻譯的歷史
2.3.2 計算機輔助翻譯的未來
2.4 計算機輔助翻譯研究框架
第三章 文檔格式處理的自動化
3.1 文檔格式與翻譯
3.2 文檔格式自動化的原理
3.2.1 可譯字串與不可譯字串
3.2.2 文件格式的自動化
3.3 SDL Trados Studio與版面格式自動化
3.3.1 軟件格式支持類型
3.3.2 翻譯單個文檔
3.3.3 可譯字串抽取
3.3.4 不可譯字串的顯示與處理
3.3.5 源語言替換
第四章 術語管理與翻譯
4.1 術語的確認
4.1.1 術語的定義
4.1.2 術語的表現(xiàn)形式
4.2 自動術語抽取
4.2.1 候選術語生成
4.2.2 術語識別原理
4.2.3 術語抽取實驗
4.3 術語數(shù)據(jù)庫的構建
4.3.1 術語知識微觀描述框架
4.3.2 術語庫的構建
4.3.3 術語更新
4.4 術語數(shù)據(jù)庫的使用
4.5 術語管理策略
第五章 翻譯記憶庫
5.1 什么是翻譯記憶庫
5.2 翻譯記憶庫的應用模式
5.2.1 SDL Trados Studio中的預翻譯模式
5.2.2 SDL Trados Studio中的句段模式
5.2.3 匹配率計算
5.3 翻譯記憶庫的構建
5.3.1 語料對齊算法
5.3.2 語料對齊工具及其使用
5.3.3 語段邊界劃分與翻譯單位
5.4 翻譯記憶庫的組織與維護
5.5 翻譯記憶庫應用的優(yōu)勢與劣勢
5.5.1 翻譯效率方面的優(yōu)勢與劣勢
5.5.2 翻譯質量上的優(yōu)勢與劣勢
第六章 翻譯質量保證
6.1 翻譯質量保證
6.2 翻譯質量檢測及其工具
6.2.1 翻譯質量檢測的原則
6.2.2 翻譯質量檢測工具
6.2.3 SDL Trados Studio 2015的翻譯質量驗證工具
6.3 翻譯質量管理體系
6.3.1 《翻譯服務譯文質量要求》
6.3.2 《翻譯質量量度》
6.3.3 《翻譯質量保證標準指南》
6.3.4 《歐洲質量標準:EN一15038》與ISO17100
6.3.5 動態(tài)質量框架
第七章 翻譯記憶庫
7.1 本地化與翻譯
7.2 軟件交互界面翻譯
7.3 Passolo與交互界面翻譯
7.4 軟件交互界面翻譯原則
7.4.1 一般性原則
7.4.2 術語翻譯規(guī)范
7.4.3 格式規(guī)范
7.4.4 不翻譯內容
7.4.5 地名
第八章 譯后編輯
8.1 定義、歷史與前景
8.2 神經機器翻譯
8.3 自動譯后編輯
8.3.1 理據(jù)
8.3.2 自動譯后編輯技術
8.4 翻譯質量評估與翻譯質量預測
8.4.1 翻譯質量評估
8.4.2 翻譯質量預測
8.5 人工譯后編輯
8.5.1 譯后編輯工作量指標
8.5.2 MT錯誤分類及其對譯后編輯工作量的影響
8.6 譯后編輯行為模式
第九章 正則表達式
9.1 什么是正則表達式
9.2 正則表達式的使用
9.3 正則表達式的結構與功能
9.3.1 與行的起始、結束相關的模塊單元
9.3.2 字符類型組相關單元
9.3.3 搭配相關模塊單元
9.3.4 詞語的多種形式與譯文的一致性
9.3.5 詞語的重復
9.3.6 翻譯贅余
9.3.7 字符的轉義
9.3.8 正則表達式注意事項
9.4 常用正則表達式對應表
附錄Ⅰ SDL Trados Studio 2015支持的文件類型
附錄Ⅱ 質量檢測工具調查
參考文獻