看好人工智慧技術發展,宏正自動科技(ATEN)早在2016年就開始關注相關技術發展,並於隔(2017)年成立研發團隊展開系列研究,最終會決定聚焦AI語音這個領域的理由有四:有智財權保護、在地需求高、有一定技術門檻,以及應用範疇廣,包含智慧助理、客服人員、AI主播、公共廣播等。
「人工智慧技術確實有開放原始碼,但是,沒有聲學、語音或語言(義)等開放原始碼模型,因此,團隊投入許多資金與資源進行研發,在2021年底研發出ATEN優聲學服務、2022年開始向市場介紹與持續優化功能服務,並於2023年7月推出『優聲學AI Voice』網路服務進行市場推廣,在短短半年餘的時間,吸引5,000名使用者註冊、超過300名客戶付費使用,每天合成的語音數量高達1,000則。」宏正自動科技系統應用研發中心協理張教勇表示,透過「優聲學AI Voice」網路服務,無論是ㄧ般民眾還是企業客戶都可以親身感受AI語音帶來的綜效,不僅能優化廣告、廣播、說書與影片介紹的成效,還可以創造差異化特色。「服務推出至今,我們不僅建立了15個聲優可合法商業使用的模型、還因應客戶需求提供超過50個客製化模型,更累積豐富經驗可以提供企業客戶專屬諮詢與建議,若客戶想要打造客製化模型,我們也可以提供相應服務。」
宏正自動科技推ATEN優聲學服務,全方位滿足商業客戶與一般民眾的AI語音生成需求
ATEN優聲學的文字轉語音(TTS)服務是利用最先進的類神經網路技術提供如真人般、在地的、有溫度的語音合成服務,讓企業可以量身訂做的好聲音為品牌與應用加值,打造絕無僅有的聆聽體驗。
張協理表示,有別於教育機構、新創乃至國際大廠推出的AI語音生成服務, ATEN優聲學具備五大差異化優勢:首先是與聲優合作、提供在地化、台灣口音的文字轉語音服務;其次是以高正確率的多音字文字系統協助企業優化語音生成、影像與音訊合成等產製效率;再來是持續擴大文字轉語音的支援語言,如國語、英語與即將推出的台語服務,讓YouTube、Podcaster、廣播等內容創作者快速合成所需語言;同時,建立與擴展專屬語音IP以滿足客戶多元需求;最後是提像真人互動一樣的體驗,更好滿足未來人機介面協作與服務需求。
ATEN優聲學服務深受客戶喜愛
ConnactAI創辦人暨執行長程峻宏十分認同的說:「我們會大量使用ATEN優聲學的原因有二:首先是多音字文字系統的正確率極高,可以正確辨識破音字、還有處理中英穿插的文字轉語音服務;其次是在地化、台灣口音的文字轉語音服務,深受我們的客戶喜愛。」舉例來說,以前客戶在錄製有破音字跟中英穿插的語音至少要3次以上才能完成,導入ATEN優聲學後,一次就可以完成,大幅提升錄製作業效率跟成本。「客戶在選擇AI語音生成服務時,特別重視速度、精準度跟調整彈性,而這也是ATEN優聲學深獲大家喜愛的原因。」
不僅協助ConnactAI優化產品,宏正自動科技將以ATEN優聲學為核心提供系列加值服務
ConnactAI成立於2016年,因應客戶需求,產品範疇含括AI電子商務平台、AI創意生成平台,以及AI數據決策平台等面向,客戶可透過AI創意生成平台生成所需圖片、文字、影片、聲音跟網頁內容,為提供客戶更在地化的影片跟聲音生成服務,ConnactAI在2023年初開始尋找夥伴,與宏正自動科技接觸以及測試ATEN優聲學服務後,ConnactAI很快就將ATEN優聲學服務導入平台、供客戶選擇,時至今日,更成為客戶AI語音生成服務的首選。
「很開心有機會跟宏正自動科技合作,不僅可以深化我們的平台服務能量,更重要的是,滿足客戶的需求,讓其可以AI創意生成平台內容持續優化AI電子商務平台服務能量,創造消費者、客戶、夥伴與ConnactAI的多贏,是我們耕耘市場的重要夥伴。」程峻宏如是說道。
ConnactAI並不是特例,隨著產品服務的到位與持續優化,ATEN優聲學的客戶與日增加,宏正自動科技除持續滿足其對產品服務的需求、深化合作關係,亦計畫從三個面向擴展服務能量:首先是與更多聲優合作建構TTS支援的語言模型,如即將推出的台語跟正在規劃的日語等,並且因應不同情境建構客製化模型;其次是提供虛擬人整合方案,滿足客戶對離線即時合成跟書本閱讀等應用的需求;最後,同時也是最重要的,建置AI工廠,持續不斷累積AI資產,爾後,因應製造、零售等不同產業需求推出最佳解方。
「針對商業客戶,我們除保障其生成的AI 語音等資訊安全、優先提供GPU運算資源、提供專屬的客製化模型,商業客戶還可以優先使用我們推出的新服務,以共創共贏的方式搶進商機龐大的AI市場。」張協理表示,關於ATEN聲優學的未來發展,宏正自動科技已規劃清楚藍圖,接下來將一步一腳印的實踐,搶進台灣乃至全球AI語音生成市場,成為公司成長的關鍵動能。
關於ATEN優聲學 AI Voice 更多介紹:https://www.aivoice.com.tw/