Meta又開源AI模型,算盤打的是「AI元宇宙」!ImageBind如何帶來多感官體驗?
Meta又開源AI模型,算盤打的是「AI元宇宙」!ImageBind如何帶來多感官體驗?

當各大科技公司在AI人工智慧的戰場上各顯身手,試圖占據AI市場的一席之地時,有個看似沉寂許久的科技巨頭,看似把未來押在虛擬世界「元宇宙」而錯失了先機,卻正在迎頭趕上,不斷推出、甚至開源自家的AI研究成果──那就是Meta。

Meta於5月9日宣布了一個新的開源AI研究項目,名為「ImageBind」,且不只可以生成文字、或是圖片,還可以串聯起文本、聽覺、視覺數據、3D深度資訊、溫度、動作數據。這可能將是虛擬世界「元宇宙」計畫的一大步,也代表未來AI的走向,將會是創造身歷其境的多感官體驗。

雖然這還在研究階段,Meta近期也還稱不上高調,但也不斷公開自家的研究項目,與相較之下越來越神秘的OpenAI和Google形成強烈對比。

延伸閱讀:塗鴉怎麼變動畫?Meta開源「AI繪圖專案」,超簡單5步驟立刻動起來

人工智慧「多模型」型態,將是生成式AI的趨勢?

早先廣為人知的生成式AI如Midjourney、Stable Diffusion和DALL-E,都是在訓練階段時就已經把文字和圖片「連接」在一起的系統,在訓練時,這些模型就會以文字敘述來尋找視覺資料中的模式。目前其他生成聲音或是短片的生成式AI也是如此。

但Meta表示ImageBind模型連結的不只文字和圖片,還包括了溫度(紅外線影像)、3D深度距離、還有用慣性測量裝置(inertial measuring unit,IMU,可在手機或智慧手錶中追蹤螢幕轉向等活動)所取得的動作數據。

這個模型將預期的成果是: 模擬人的感知 ,用有限的數據來生成複雜的場景。如果未來能夠搭配虛擬實境設備使用,ImageBind不僅可以生成感官效果,還可以在使用者所在的站台或座椅環境生成動作或效果。例如:輸入「長途旅行」,ImageBind可能就可以讓你置身於搖晃的甲板,讓你聽到海浪聲,並給你陣陣涼爽的海風。

元宇宙  metaverse
Meta宣布新的開源AI研究項目「ImageBind」,不只可以生成文字、圖片,還可以串聯起聽覺、視覺數據、3D深度資訊、溫度、動作數據。這可能將是虛擬世界「元宇宙」計畫的一大步。
圖/ shutterstock

Meta也在官方部落格指出,未來其他感覺數據也會添加到模型當中,例如觸覺、嗅覺和大腦fMRI信號等。文章中也指出,這個研究讓AI生成模型「更接近人類在許多不同形式的資訊當中,同步、整體且直接的學習。」

不過,這都還只是研究項目,目前都沒有實際的應用成果或消費者心得。不過,繼去年9月Meta低調推出短片生成AI模型後,這個研究項目在未來,也可能會是Meta元宇宙大夢的重要里程碑。

Meta早就是AI老手?大方開源AI研究,能搶先訂下標準?

儘管低調,人工智慧在Meta早就已經是旗下Facebook或Instagram貼文與短影音的幕後關鍵。用戶在Instagram上看到的所有內容中,就約有40%是由AI推薦的,而Instagram和Facebook兩個一起算的話,比率則是20%。在業務方面,Meta的主要業務──銷售廣告,也是AI來操盤的。

Meta在AI領域的最大優勢之一,就是旗下的研究部門,許多專家認為,Meta團隊的競爭力並不輸Google和OpenAI等同行。

延伸閱讀:AI、虛擬世界我全都要!祖克柏加碼提新概念「AI代理人」,那是什麼?

雖然Facebook和Instagram大量使用AI,但Meta的應用程式都不允許人們創建新內容,如文本或影像。外媒《Vox》指出,可能跟Meta長期被控「散播仇恨言論、錯誤訊息」的罵名有關,Meta還不想倉促建立一個會產生更多有害或是不正確內容的工具。

其實,Meta已經嘗試過了,他們去年11月所發布、以學術論文進行訓練的實驗性AI工具「Galactica」吐出了不符合事實的種族主義訊息,在三天內就被撤下了。

Meta
Meta在AI領域的最大優勢之一,就是旗下的研究部門,許多專家認為,Meta團隊的競爭力並不輸Google和OpenAI。
圖/ Canva

Meta同時也面臨硬體設備難以執行人工智慧系統的問題。去年9月,Meta內部發布的一份備忘錄表示,該公司「在AI開發方面,工具、工作流程和製程方面存在重大差距」,並且需要「在這方面進行大量投資」。

不過,Meta的人工智慧研究部門仍定期發布公開的AI研究論文(不包括社群媒體演算法的AI)。其他AI公司,如Google和OpenAI因競爭而不那麼願意公開研究成果。

Meta執行長馬克.祖克柏就曾表示, 公開研究成果可以讓Meta率先制定AI產品開發的行業標準,並讓外部開發者更好地融入Meta的生態系統 。今年2月,Meta的研究部門與研究人員就開放LLaMA的大型語言模型給AI社群索取使用權限。

LLaMA的能力目前落後於OpenAI最新的GPT4模型以及Google的Bard,但開放資源仍然代表著AI研究社區不須強大的電腦,就可以修改底層程式碼。但這也有專家認為,過於自由的開放可能會遭到惡意使用。

延伸閱讀:Meta要改名成「MetAI」?祖克柏過度沉醉AI世界,分析師發出警告

資料來源:The VergeengadgetVox

責任編輯:林美欣

往下滑看下一篇文章
元健助聽器攜手 EVOX 啟動雲端革命:從電話到數據,打造可量化的客戶經營新模式
元健助聽器攜手 EVOX 啟動雲端革命:從電話到數據,打造可量化的客戶經營新模式

面對消費者注意力日益分散、行銷成本節節攀升的挑戰,企業能否在每一次互動中精準把握「關鍵時刻」,已成為站穩市場的決勝點。

台灣助聽器領導品牌元健大和(元健助聽器),不僅透過雲端服務優化配戴體驗,更攜手 E2 Nova 易得雲端(EVOX)打造企業級顧客互動平台,透過 EVOX CloudTalk 雲端電話總機與 EVOX Connect 全渠道雲端聯絡中心,元健助聽器成功的將傳統通訊互動內容轉化為可追蹤、可分析的數據資產,不僅大幅優化客服品質與內部溝通效率,更讓「電話」跳脫單純的服務功能,轉變為驅動營運成長與精算廣告投放效益的核心引擎。

人人買得起、願意戴的助聽器

在全球助聽器品牌中,元健助聽器是少數以「服務創新」來驅動產業變革的代表。董事長吳少暉看見使用者長年面臨的「貴、遠、醜」三大痛點,亦即價格負擔高、服務據點有限及外型選擇不足,決定將「提升助聽器普及率」定為品牌使命,直球對決這三大使用門檻。

EVOX-2.JPG
元健助聽器從產品、通路到服務模式全面重構助聽器的使用體驗,希望解決價格負擔高、服務據點有限及外型選擇不足等痛點。
圖/ 數位時代

為此,元健助聽器從產品、通路到服務模式全面重構助聽器的使用體驗。除了優化產品設計,廣泛佈建電商平台、電視購物等多元通路,主動挖掘潛在消費者外,亦於 2018 年率先推出雲端服務,透過 App 提供聽力檢測、調整助聽器設定等服務,不僅為使用者省去往返門市的時間與不便,也降低服務成本,讓助聽器從過去的高門檻醫療輔具,轉變為更多人可以負擔、可以使用的日常產品。

元健助聽器雲端布局的前瞻性,使其能較同業累積更多用戶數據與實戰經驗,形成難以複製的競爭優勢。如今,元健助聽器已是台灣助聽器與聽力服務市場上銷量第一的品牌,並以兩成市佔、全台 66 間門市為根基,將服務版圖延伸至泰國、馬來西亞、菲律賓、印度、日本及美國等海外市場。

從電話到數據:元健助聽器打造可量化的客戶轉換路徑

隨著服務版圖快速擴張,帶動元健助聽器的營運規模同步成長,挑戰也隨之浮現。吳少暉表示,傳統電話總機系統的建置與維護成本相當高,還可能因為突發狀況而導致服務中斷、流失商機,更重要的是,整體客戶服務流程缺乏可視性。

過往的廣告宣傳,僅能仰賴各門市店長回報新客來電數量,數據不即時且準確性不足,當成效不如預期時,更難以判斷問題究竟出在哪裡,是行銷文案不夠動人?或是門市服務需要再優化?為此,元健助聽器導入 EVOX CloudTalk 雲端電話總機,不僅省去主機建置與維運成本,更將每一通來電從「聲音」轉化為「數據」,從而提升整體服務效率。

透過 EVOX 的數位足跡,元健助聽器建立起一套從「曝光、點擊、來電到到店」的完整轉換路徑:從廣告投放帶來的網站流量、分店頁面點擊,到客戶實際撥打電話的行為,甚至每一通來電的接聽狀況與通話內容,皆能被 EVOX CloudTalk 完整記錄與分析。

吳少暉指出,現在團隊能以「來電數」作為評估指標,分析與比較不同行銷文案和廣告投放策略的成效,這讓元健助聽器成功擺脫過往「憑經驗、靠感覺」的決策模式,取而代之的是透過數據精準掌握不同區域與族群的需求差異,進一步優化行銷與服務策略,讓每一分行銷預算都能發揮最大戰力。

EVOX-3.JPG
元健大和董事長吳少暉指出, EVOX CloudTalk 讓公司能以「來電數」作為評估廣告投放成效的指標,讓每一分行銷預算都能發揮最大戰力。
圖/ 數位時代

EVOX Connect 帶來6大效益,讓客服成為營運成長引擎

在建立數據決策文化後,吳少暉進一步思考,如何讓每一通來電創造更高價值?過去由各門市自行接聽電話,不僅服務品質難以保持一致,也讓門市人員在現場服務與接聽電話之間分身乏術。因此,元健助聽器於 2023 年成立專責客服團隊,並導入 EVOX Connect ,將新客來電集中至客服部門,讓門市人員能專注於客戶到店後的體驗與售後服務。

吳少暉認為, EVOX Connect 為元健助聽器帶來六大關鍵效益。首先,自動輪派機制,兼具效率與公平:系統依照預設棒次自動分派來電給客服人員,解決過往搶線或來電分配不均的問題,顯著提升整體接線效率。

其次,動態狀態管理,服務永不中斷:當客服人員請假、離席或暫時無法接聽電話時,可暫時將服務狀態調整為下線,系統會自動將來電轉派給其他人員,確保服務不中斷。

第三,自動撥號機制,效率提升 5 倍:過去,客服人員有很多時間花費在手動撥號及等待接通上,而 EVOX Connect 的自動撥號功能可同時撥出多通電話,並僅保留成功接通的電話,大幅節省客服人員等待時間,也讓撥號效率提升 5 倍。

第四,嚴謹個資防護,強化企業合規: EVOX Connect 可集中匯入客戶資料與自動撥號機制,減少客服人員直接接觸完整顧客資訊的機會,不僅提升顧客個資安全性,也強化企業在法規與稽核下的合規能力。

第五,開放 API 整合,打造多元應用。 EVOX Connect 提供相當完整的 API 與技術文件,讓元健助聽器能與內部系統進行整合,發展更多元的應用場景。吳少暉舉例指出,目前與外部夥伴合作開發的 AI 客服系統,便是透過 EVOX Connect 所提供的 API 進行整合,讓非營業時間的來電可以交由 AI 客服即時回應,避免潛在商機流失,實現 24 小時服務不打烊的目標。

EVOX-4.JPG
元健大和與外部夥伴合作開發 AI 客服系統,並透過 API 介接 EVOX Connect ,讓非營業時間的來電可以交由 AI 客服即時回應,實現 24 小時服務不打烊的目標。
圖/ 數位時代

第六,通話錄音轉化教材,複製成功經驗:透過系統內建的通話錄音功能,讓元健助聽器可挑選優秀的客服互動案例並轉化為教材,協助各門市人員精進溝通技巧,讓服務經驗得以複製與傳承,進一步提升整體服務品質。

元健助聽器與 EVOX 多年的合作,已從單一品牌的數位轉型,擴展至母集團全面導入雲端系統的策略升級。這份信任,來自於雙方在企業文化與發展方向上的高度契合,以及 EVOX 系統在擴充性與整合性上的優勢,能滿足公司不同成長階段的需求。未來,元健助聽器將加速拓展海外市場,希望藉由 EVOX 建立單一管理後台,將客戶互動轉化為可持續累積的數據資產,為邁向全球市場奠定關鍵基礎。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓