4/21/2018 10:31:00 AM
翻譯自動化行業的現狀及以后發展趨勢
2017年12月13日,翻譯自動化用戶協會(Translation Automation User Society,簡稱TAUS)發布了一份題為《Nuncest Tempus:Redesign Your Translation Business,Now!》的最新翻譯行業報告,分析了大數據和全球化背景下,翻譯行業今后的發展趨勢和前景。該報告分為“找準時機”、“翻譯行業六大驅動力”、“現代翻譯管道”和“翻譯行業掌門人經驗”四個章節。樂文翻譯通讀報告后,為大家提煉出值得關注的翻譯行業的現狀和發展趨勢供大家參閱:
S-曲線
第一章中,報告提出了一個叫做S曲線的概念,指出一種科技的發展,都會經歷公司內部研發,該公司內部所有,再演變成一種服務和工具,最終集成到更新的技術平臺中的小功能的過程。
那么應用到翻譯領域呢?
80年代,一些公司隨著自身的向外拓張,出現翻譯需求,在公司內部成立翻譯部門;90年代翻譯行業出現外包服務商,承接翻譯服務;2000年早期Trados,memoQ等的翻譯記憶庫工具誕生,幫助譯者提高翻譯質量和效率;2000年后期垂直領域工具和統計機器翻譯(SMT)逐漸興起;現如今,神經機器翻譯(NMT)的大火。很顯然,就我們經常使用的谷歌、百度和有道翻譯等機器翻譯軟件來看,翻譯產業已經到達了S曲線的頂峰。

翻譯行業已從勞動密集型轉向數據驅動型
以往的翻譯行業是勞動力驅動的行業,以低報價獲得客戶訂單,翻譯質量偏低。在大數據時代,一些高質量的語言資產得以保留下來復用,并導入翻譯機器中進行訓練,出現了機器翻譯比人工翻譯質量更好的例子。漸漸地,人們發現數據的重要性,在某些通用場景下,機器翻譯做的反而比人工翻譯好,并且成本更低,于是業內開啟了一場爭奪數據的戰爭。誰能獲取優質的數據資源,就能提供更好的翻譯服務。
語音翻譯和語音控制
TAUS預測,2020年,全球半數的智能手機用戶都將使用語音科技。常常勾搭Siri的同學對此應該不陌生。隨著語音技術正在飛速發展,語音識別、音頻轉文字等技術的出現,大大方便了我們的生活,也拓寬了語音翻譯的使用場景。
現代翻譯管道
TAUS報告中提出了現代翻譯管道,Modern Translation Pipeline(MTP)的概念,是一種圍繞機器翻譯架構起來的系統,架構如下:

(1)管道的三大特點
管道的運行是由數據驅動;
具有自發性、自驅動力,自動化程度高;
對多數人來說翻譯是無形的一種服務。
(2)管道分層
管道分為兩層架構:
第一層是大公司或超強技術公司,他們負責研發和維護支持翻譯產業的技術架構,如谷歌研發出神經翻譯網絡;而第二層是其他技術公司,他們利用上一層的標準架構,開發專門的增值業務,如開發接入神經機器翻譯的接口。
(3)管道要素:
管道的架構搭好后,里面的要素主要有四個:
量子跳盒子:代表最佳的翻譯技術:機器翻譯(MT),翻譯記憶庫(TM),眾包和社區翻譯。
算法管理盒子:隨著機器學習的進步,一些翻譯系統可以自動選擇譯者和審校,分析文本、質量控制,實現一個系統就能達到一個翻譯公司的效果。
數據化盒子:
內容數據:指TM,原文、譯文等的語言數據,是定制MT引擎的關鍵。
元數據:指語言對、流程、產業和個人信息等元數據,是訓練機器學習和算法管理的關鍵。
儀表盤。所有盒子都在這一管道中后,需要一個儀表盤來追蹤數據,從翻譯完之后的數據中獲取更多洞見。
今后翻譯行業的工作趨勢
工程師:幫助搭建管道。
數據分析師:分析儀表盤反映出的數據,獲取更多洞見。
語言人士開始從譯者的角色,轉變為從事審校、創譯和譯后編輯工作。