那個支援AlphaGo贏得圍棋比賽的深度神經網路如今又要有新的表現,Google即將把它應用於Google翻譯中,讓機器翻譯更加通順流暢,表意清晰。目前該系統僅應用於中文到英文的語言翻譯。
Google表示,新的翻譯系統簡稱為Google神經機器翻譯(Google Neural Machine Translation-GNMT),就某些語言而言,GNMT錯誤率可以減少60%。
該專案的負責人之一,同時也是Google智庫成員的工程師Mike Schuster談到:
我們將按照「端到端」的模式對整個系統進行統一訓練,這可以使公司更專注於減少翻譯的錯誤率方面。雖然現在還並不完美,但的的確確是完善了很多。
在機器翻譯方面,Google使用的深度神經網路叫做LSTM(long short-term memory – 長期短期記憶)。 LSTM可以保留長期和短期的記憶,有點像人類的大腦,這使得它可以用更複雜的方式進行學習。
和Google以前的短語翻譯系統(Phrase-Based Machine Translation-PBMT)不同,LSTM可以從頭到尾記住一句話再進行翻譯,使長句翻譯不再是單詞的拼湊,而是流暢通順的語言。
其實多年以來,Google一直想讓LSTM服務於翻譯工作,然而一直無法攻克翻譯速度這個難題。直到做了大量的工程和演算法工作,才得以完善這個模型,讓新神經機器翻譯系統能夠在跨越大型的Internet服務時保持工作速度。
Google還計劃利用新系統推出10,000多個語言對的機器翻譯。
本文授權轉載自:愛范兒