Meta推出名為「S2UT」 (speech-to-unit translation) 的翻譯技術,將使原本沒有特定文字書寫紀錄的語言,可以直接透過語音對語音翻譯方式轉換成另一種語言,例如將台灣等亞洲地區多人使用的閩南語直接翻譯成英語,同時也能將英語直接翻譯成閩南語。
Meta超酷新技術「S2UT」,可用AI轉譯「沒有實際文字」的語言
這項翻譯技術主要是 將沒有實際文字的語言念音轉換為數位聲波資料,並且與其他可轉為文字內容的語言透過機器學習交叉比對,藉此建立標示與分類 ,未來即可透過識別念音,直接將沒有實際文字的語言翻譯成其他語言。
而如果碰到未建立標示及分類的情況,系統則會透過另一套翻譯流程,藉由其他語言進行轉譯,例如在閩南語原意無法直接以英語詮釋情況下,若可以透過中文詮釋,系統就會參考中文內容再翻譯為英語。
Meta為何選擇閩南語?
之所以選擇以閩南語作為此技術第一個對應語言,Meta表示,目前使用閩南語的使用人口超過5,000萬人,同時也是中文語系中的代表語言之一;但也因為沒有文字,因此無法透過一般翻譯技術轉換成其他語言。推出此項技術, Meta希望能讓眾人可以打破語言隔閡,以最自然形式進行交流,藉此促成更深入的互動 。
Meta接下來將對外開放名為「LASER」的自然語言處理工具,所打造SpeechMatrix大型語音對語音訓練模型,讓更多研究人員可以建立眾多無法透過文字紀錄的語言,讓更多語言可以透過人工智慧方式翻譯成其他語言。
責任編輯:林美欣