Meta推出AI大型語言模型,可轉換1,100種語言!秘訣在於:餵它吃多國《聖經》
Meta推出AI大型語言模型,可轉換1,100種語言!秘訣在於:餵它吃多國《聖經》

Meta今(23)日發表一系列AI大型語言模型,可以辨識多達4,000種語言,語音和文字互相轉換的技術也支援1,100種語言,多國語言版的《新約聖經》也是訓練資料之一。

Meta表示,這項技術將會開源,希望幫助更多用戶以自己習慣的語言,更輕鬆地獲取資訊及使用電子裝置。

Meta「MMS」AI模型,可轉換千種語言、也能辨識4,000種口語語言!

Meta的大規模多語言語音(Massively Multilingual Speech,或簡稱為MMS),由模型擴展成文字轉語音、語音轉文字技術的應用範圍,從最初的100種語言,至今已可轉換超過1,100種語言,超越過去的10倍,此外還能夠辨識超過4,000種口語語言,是過去的40倍。

這項技術已有許多應用案例,從VR、AR到訊息服務,能夠使用偏好的語言操作,更可理解每個人的聲音。Meta將會開源這項技術的原始碼及模型,讓研究社群能夠以現有的工作成果為基礎繼續開發,一同保存全球的語言,並拉近人們之間的距離。

Meta 的大規模多語言語音模型擴語音技術的應用範圍,從 100 種語言,至今已可轉換超過 1 千
Meta 的大規模多語言語音模型擴語音技術的應用範圍,從 100 種語言,至今已可轉換超過 1100種。
圖/ Meta

Meta蒐集上千種語言,《聖經》也是訓練資料

過去最大型的語音資料庫最多僅涵蓋100種語言,因此開發此技術所面臨的第一個挑戰即為「蒐集數千種語言的語音訓練資料」。為了克服這項挑戰,Meta使用已翻譯成多種語言、譯文已被廣泛閱讀及研究的宗教經典,例如《聖經》,作為語言的文字訓練資料。

《聖經》譯文有多種語言的公開錄音檔,作為大型多語言語音模型計畫的一部分,Meta創造的資料集,蒐集超過1,100種語言的《新約聖經》有聲讀物資料集,平均為每種語言提供32小時的語音訓練資料,後續又加入其他未標註的基督教有聲讀物後,可用的語言訓練資料已涵蓋超過4,000種語言。

延伸閱讀:三星預設瀏覽器不換Bing了?Google加速新AI產品「Magi」

雖然資料集收錄的聲音以男性居多,但測試成果顯示,不論是男性或女性的聲音,此語音模型皆能同等準確地辨識。此外,上述的語言訓練資料大多為宗教相關的內容,但根據Meta的分析顯示,這並不會使模型傾向於生成出更多的宗教性質的語言。

bible-4756370_1920.jpeg
聖經也是Meta的訓練資料之一。
圖/ pixabay

Meta表示,將持續擴增大規模多語言語音模型的涵蓋範圍,以支援更多語言的轉換及辨識,並努力克服現有語音技術難以處理方言的挑戰。

延伸閱讀:比爾蓋茲:AI助理改寫遊戲規則,Google、亞馬遜都將消失

責任編輯:林美欣

本網站內容未經允許,不得轉載。
往下滑看下一篇文章
提供在地服務、鏈結全球網絡!KPMG台灣創新科技大賽,助新創躍登國際舞台!
提供在地服務、鏈結全球網絡!KPMG台灣創新科技大賽,助新創躍登國際舞台!

從2021年至今,每年11月在葡萄牙里斯本舉辦的Web Summit大會期間,都會有一場扣人心弦的「KPMG Global Tech Innovator」(以下稱KPMG GTI)全球總決賽。包括KPMG台灣、瑞典、巴西等各個國家的會員所,會在國內先經過激烈競選、推派出一組代表隊後,接著再由KPMG全額贊助,前往里斯本,一同展開一場新創間的「國際擂台賽」,「這是目前全球規模最大的新創賽事。」KPMG安侯建業創新與新創服務團隊主持會計師黃海寧強調。

KPMG GTI 規模最大新創賽事、創業風向球

她進一步解釋,由KPMG Global Private Enterprise創新創業服務網絡平台舉辦的KPMG GTI,一方面是為了提供各國新創產業在地服務,同時也是透過KPMG的國際網絡,為新創鏈結全世界。

如今,隨著賽事即將邁入第四屆,KPMG GTI幾乎已成為全球新創的風向球,每年進入決賽的隊伍,都是站在趨勢上創業。例如2021年有17個國家的KPMG會員與會,裡頭的主題包括AI和機器學習、金融科技與金融服務應用、零售和電商等,而台灣選出的代表隊,是投入AI、致力找出數據價值的InfuseAI;2022年增加至22個國家與會員所參賽,隨著ESG浪潮興起,在前三名中,包括能源跟潔淨科技、電商與零售的應用和健康科技等主題,台灣則由開發次世代眼動追蹤模組的見臻科技入選;2023年再度擴增至23個國家、隊伍與會,永續、AI和機器學習、金融科技一樣是熱門議題,黃海寧觀察,歐洲與中東國家的隊伍對「永續」議題著力甚深,尤其聚焦在像氫能等新潔淨能源解決方案的提供與應用,而耕耘永續、減碳的台灣代表活優科技,同樣不落人後,專注在植物肉油脂的研發。

特別的是,在KPMG GTI全球總決賽中,所有參賽隊伍需要在一周前抵達里斯本,準備事前採訪、與創業導師的三次一對一對談。所有採訪、短片錄製都採最高規格,由知名科技節目《Beyond Innovation》的主播兼製作人 Michael Bancroft進行訪談,Michael Bancroft也會在決賽的pitch時刻,擔任主持。來自全球知名創投機構、加速器和科技巨擘的評審,則會在團隊結束三分鐘的簡報後,針對選題、商業模式、短中長期發展規劃等環節,提出簡潔但直指核心的問題,「這是一場體現『創業無國界』精神的賽事,尤其團隊都是以『革命性的高科技』為題,不只要解決台灣一小撮人的問題,而是整個地球的問題,每一個建議都會非常受用。」黃海寧說。

401262861_658074446472924_4133069903260611896_n.jp
圖/ KPMG

賽事結束後,由於KPMG擁有完整的創新創業服務網絡平台和資料庫,所有參賽隊伍的資料,都會被收錄到KPMG的平台和資料庫中,方便全球投資人尋找標的,等於團隊不需要到不同國家、台灣駐各國的辦事處一一叩門,「只要透過KPMG的平台,直接在全球23個國家,都能找到對的資源。因為每個國家背後,就是一個KPMG的新創服務團隊在支援他們。」

從第一屆至第三屆,台灣的新創代表在KPMG GTI全球決賽中都收穫滿滿。那麼,究竟要如何才能脫穎而出,成為「KPMG GTI台灣創新科技大賽」的冠軍,代表台灣出賽?

選拔台灣代表 著重前瞻性、創業的人文素養

黃海寧解釋,賽事鎖定創立2至5年的早期科技新創,團隊首先必須經過書面初審,接著在決選的pitch中,展現自己的主題、技術、產品與商業模式,最終由9位評審團共同做出決定,「我們挑選代表隊的考量點,並非是已經募到很多資金、開始有許多訂單、高營收的閃亮明星。評審反而更希望看到具前瞻性、充滿信心的團隊。」

由於評審團中,KPMG僅占2個名額,另外7位是創投、加速器的代表,因此也能推薦各自輔導的團隊前來參賽,目的是期望藉由多元的評審團組成,擴大參賽團隊範圍,找出遍布台灣的優秀隊伍。

即便新創最終沒有成為代表台灣出征的團隊,但只要是進入前10名的隊伍,評審團便會設計各式各樣的課程、資源,協助新創在未來一年中快速成長。近來,黃海寧就觀察到,許多在0到1階段團隊的主要投資人,其實是台灣的中小企業主,但由於投資人和團隊間缺乏理解、互信,對新創的未來走向、產品發展等問題的看法可能天差地遠,導致新創無法挺過死亡幽谷,最終不幸夭折。因此,包括信任關係、基礎會計財報知識、法律知識、股權結構等,都是KPMG會提供新創團隊的重要課程內容。

366809329_607452221535147_8304102715319474388_n.jp
圖/ KPMG

另外,過去KPMG的媒合區域較著重在北區,且多為幾間固定的大企業;今年,KPMG預計增加中小企業與新創間的媒合,會再將媒合範圍擴大至南部,建立與億載會、磐石會等團體的合作關係。

目前,第四屆的KPMG GTI台灣創新科技大賽已經開跑,對於有心參與KPMG GTI競賽、成為台灣代表隊的新創,黃海寧透露,她經常在國外的創業團隊身上,看到對技術和產品的自信、對夢想的擘畫、對技術的擁抱,以及愛護地球的態度。她建議團隊參賽前,可以向不同面向的專家虛心求教,讓專家將技術、產品、商業模式協助修整到對的樣態,再端上舞台,「產品、技術固然重要,但建立與利害關係人的互信、培養『創業的人文素養』,也會是新創能否走得長久的關鍵。」

第四屆的KPMG GTI台灣創新科技大賽,瞭解更多:
https://kpmg.com/tw/en/home/insights/2024/03/global-tech-innovator.html

本網站內容未經允許,不得轉載。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
台日半導體新局 全解讀
© 2024 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓