4/25/2018 2:53:00 PM
機器翻譯的發展歷程
機器翻譯、智能翻譯、人工智能越來越受到廣大人民的喜愛,你知道機器翻譯是如何發展的?經歷了哪些嗎?
機器翻譯達到目前的水平,經過了幾十年的發張,并經歷了三次飛躍。
早在1954年,人類就開始嘗試過讓機器能識別人類的語言,但直到上世紀80年代,才有人摸索出方法。當時,IBM做了研究,利用一些規則方法,句法分析,語意分析等傳統方法讓機器看懂人類語言。但由于當時的人工智能發展處于“凜冬時期”,效果一直不好,翻譯質量也一直上不去。機器翻譯的第一個飛躍也是IBM做出的。IBM的研究人員用了統計的方法來做機器翻譯。那時,語音識別從傳統的人工智能方法專家系統轉為統計學習的方法,尤以隱馬爾科夫模型為代表。統計學方法的應用讓機器翻譯在上世紀90年代有了質的飛躍。
神經機器翻譯,簡要的說,就是對源語言的句子進行編碼,即轉化為計算機可以“理解”的形式,編碼的結果會形成很多隱含變量,每個隱含變量代表從句首到當前詞匯為止的語義信息。然后通過一個解碼的過程,一個詞、一個詞輸出譯文。
到了2018年,由微軟亞洲研究院與雷德蒙研究院研發的機器翻譯系統,解決了NMT方法的一些局限,并借鑒了人類翻譯過程中的一些方式。例如:對偶學習(Dual Learning)、推敲網絡(Deliberation Networks)、一致性規范(Agreement Regularization)、聯合訓練(Joint Training)等,讓機器翻譯水平得到了大大提升。
從機器翻譯的三次飛躍上不難看出,一家公司構建的翻譯系統效果如何,主要取決與兩點:一是算法是否足夠好,二是數據是否夠全、夠多。
這樣看,對于大公司來說,他們有足夠優秀的人才來搭建神經網絡,也有足夠多的搜索數據可供自己搭建的網絡進行訓練。由于本身在語音識別上有較長時間的積累,自然語言資料庫上有優勢。
樂文翻譯公司也在不斷完善自己的技術,從語法、專業性上有了突飛猛進的提高,有翻譯服務相關的需求,可以隨時與我公司聯系,客服熱線:400-895-6679