微軟研發的翻譯機器幾乎可以媲美專業的翻譯人員了

由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊今日宣佈,其研發的機器翻譯系統在通用新聞報導測試集newstest2017的中翻英測試集上,達到了可與人工翻譯媲美的水準。newstest2017新聞報導測試集由產業界和學術界的合作夥伴共同開發,並於去年秋天在WMT17大會上發佈。

微軟技術院士,負責微軟語音、自然語言和機器翻譯工作的黃學東稱,這是對自然語言處理領域最具挑戰性任務的一項重大突破。「在機器翻譯方面達到與人類相同的水準是所有人的夢想,我們沒有想到這麼快就能實現。」他表示,「消除語言障礙,代表人們的溝通進步,這非常有意義,值得我們多年來為此付出的努力。」機器翻譯是科研人員攻堅了數十年的研究領域,雖然此次突破意義非凡,但研究人員也提醒大家,這並不代表人類已經完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。

微軟研發的翻譯機器幾乎可以媲美專業的翻譯人員了
▲微軟技術院士 黃學東

微軟亞洲研究院機器學習組將他們的最新研究成果 – 對偶學習(Dual Learning)和推敲網路(Deliberation Networks)應用在此次取得突破的機器翻譯系統中。微軟亞洲研究院副院長、機器學習組負責人劉鐵岩介紹道,「這兩個技術的研究靈感其實都來自於我們人類的做事方式。」對偶學習利用的是人工智慧任務的天然對稱性。當我們將其應用在機器翻譯上時,效果就好像是通過自動校對來進行學習 – 當我們把訓練集中的一個中文句子翻譯成英文之後,系統會將相應的英文結果再翻譯回中文,並與原始的中文句子進行比對,進而從這個比對結果中學習有用的回饋資訊,對機器翻譯模型進行修正。而推敲網路則類似於人們寫文章時不斷推敲、修改的過程。通過多輪翻譯,不斷地檢查、改善翻譯結果,從而使翻譯的品質大幅提升。

微軟研發的翻譯機器幾乎可以媲美專業的翻譯人員了
▲微軟亞洲研究院副院長、機器學習組負責人 劉鐵岩

周明帶領的自然語言計算組多年來一直致力於攻克機器翻譯,這一自然語言處理領域最具挑戰性的研究任務。周明表示:「由於翻譯沒有唯一的標準答案,它更像是一種藝術,因此需要更加複雜的演算法和系統去應對。」自然語言計算組基於之前的研究積累,在此次的系統模型中增加了另外兩項新技術:聯合訓練(Joint Training)和一致性規範(Agreement Regularization),以提高翻譯的準確性。聯合訓練可以理解為用反覆運算的方式去改進翻譯系統,用中英翻譯的句子對去補充反向翻譯系統的訓練資料集,同樣的過程也可以反向進行。一致性規範則讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結果。

微軟研發的翻譯機器幾乎可以媲美專業的翻譯人員了
▲微軟亞洲研究院副院長、自然語言計算組負責人 周明

newstest2017新聞報導測試集包括約2000個句子,由專業人員從線上報紙樣本翻譯而來。微軟團隊對測試集進行了多輪評估,每次評估會隨機挑選數百個句子翻譯。為了驗證微軟的機器翻譯是否與人類的翻譯同樣出色,微軟沒有停留在測試集本身的要求,而是從外部聘請了一群雙語語言顧問,將微軟的翻譯結果與人工翻譯進行比較。驗證過程之複雜也從另一個側面展現了機器翻譯要做到準確所面臨的複雜性。對於語音辨識等其它人工智慧任務來說,判斷系統的表現是否可與人類媲美相當簡單,因為理想結果對人和機器來說完全相同,研究人員也將這種任務稱為模式識別任務。

然而,機器翻譯卻是另一種類型的人工智慧任務,即使是兩位專業的翻譯人員對於完全相同的句子也會有略微不同的翻譯,而且兩個人的翻譯都不是錯的。那是因為表達同一個句子的“正確的”方法不止一種。 複雜性讓機器翻譯成為一個極有挑戰性的問題,但也是一個極有意義的問題。劉鐵岩認為,我們不知道哪一天機器翻譯系統才能在翻譯任何語言、任何類型的文本時,都能在“信、達、雅”等多個維度上達到專業翻譯人員的水準。不過,他對技術的進展表示樂觀,因為每年微軟的研究團隊以及整個學術界都會發明大量的新技術、新模型和新演算法,「我們可以預測的是,新技術的應用一定會讓機器翻譯的結果日臻完善。」

 

史塔夫短評: 翻譯人員似乎還能鬆一口氣