Meta又開源AI模型,算盤打的是「AI元宇宙」!ImageBind如何帶來多感官體驗?
Meta又開源AI模型,算盤打的是「AI元宇宙」!ImageBind如何帶來多感官體驗?

當各大科技公司在AI人工智慧的戰場上各顯身手,試圖占據AI市場的一席之地時,有個看似沉寂許久的科技巨頭,看似把未來押在虛擬世界「元宇宙」而錯失了先機,卻正在迎頭趕上,不斷推出、甚至開源自家的AI研究成果──那就是Meta。

Meta於5月9日宣布了一個新的開源AI研究項目,名為「ImageBind」,且不只可以生成文字、或是圖片,還可以串聯起文本、聽覺、視覺數據、3D深度資訊、溫度、動作數據。這可能將是虛擬世界「元宇宙」計畫的一大步,也代表未來AI的走向,將會是創造身歷其境的多感官體驗。

雖然這還在研究階段,Meta近期也還稱不上高調,但也不斷公開自家的研究項目,與相較之下越來越神秘的OpenAI和Google形成強烈對比。

掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息

延伸閱讀:塗鴉怎麼變動畫?Meta開源「AI繪圖專案」,超簡單5步驟立刻動起來

人工智慧「多模型」型態,將是生成式AI的趨勢?

早先廣為人知的生成式AI如Midjourney、Stable Diffusion和DALL-E,都是在訓練階段時就已經把文字和圖片「連接」在一起的系統,在訓練時,這些模型就會以文字敘述來尋找視覺資料中的模式。目前其他生成聲音或是短片的生成式AI也是如此。

但Meta表示ImageBind模型連結的不只文字和圖片,還包括了溫度(紅外線影像)、3D深度距離、還有用慣性測量裝置(inertial measuring unit,IMU,可在手機或智慧手錶中追蹤螢幕轉向等活動)所取得的動作數據。

這個模型將預期的成果是: 模擬人的感知 ,用有限的數據來生成複雜的場景。如果未來能夠搭配虛擬實境設備使用,ImageBind不僅可以生成感官效果,還可以在使用者所在的站台或座椅環境生成動作或效果。例如:輸入「長途旅行」,ImageBind可能就可以讓你置身於搖晃的甲板,讓你聽到海浪聲,並給你陣陣涼爽的海風。

元宇宙  metaverse
Meta宣布新的開源AI研究項目「ImageBind」,不只可以生成文字、圖片,還可以串聯起聽覺、視覺數據、3D深度資訊、溫度、動作數據。這可能將是虛擬世界「元宇宙」計畫的一大步。
圖/ shutterstock

Meta也在官方部落格指出,未來其他感覺數據也會添加到模型當中,例如觸覺、嗅覺和大腦fMRI信號等。文章中也指出,這個研究讓AI生成模型「更接近人類在許多不同形式的資訊當中,同步、整體且直接的學習。」

不過,這都還只是研究項目,目前都沒有實際的應用成果或消費者心得。不過,繼去年9月Meta低調推出短片生成AI模型後,這個研究項目在未來,也可能會是Meta元宇宙大夢的重要里程碑。

Meta早就是AI老手?大方開源AI研究,能搶先訂下標準?

儘管低調,人工智慧在Meta早就已經是旗下Facebook或Instagram貼文與短影音的幕後關鍵。用戶在Instagram上看到的所有內容中,就約有40%是由AI推薦的,而Instagram和Facebook兩個一起算的話,比率則是20%。在業務方面,Meta的主要業務──銷售廣告,也是AI來操盤的。

Meta在AI領域的最大優勢之一,就是旗下的研究部門,許多專家認為,Meta團隊的競爭力並不輸Google和OpenAI等同行。

延伸閱讀:AI、虛擬世界我全都要!祖克柏加碼提新概念「AI代理人」,那是什麼?

雖然Facebook和Instagram大量使用AI,但Meta的應用程式都不允許人們創建新內容,如文本或影像。外媒《Vox》指出,可能跟Meta長期被控「散播仇恨言論、錯誤訊息」的罵名有關,Meta還不想倉促建立一個會產生更多有害或是不正確內容的工具。

其實,Meta已經嘗試過了,他們去年11月所發布、以學術論文進行訓練的實驗性AI工具「Galactica」吐出了不符合事實的種族主義訊息,在三天內就被撤下了。

Meta
Meta在AI領域的最大優勢之一,就是旗下的研究部門,許多專家認為,Meta團隊的競爭力並不輸Google和OpenAI。
圖/ Canva

Meta同時也面臨硬體設備難以執行人工智慧系統的問題。去年9月,Meta內部發布的一份備忘錄表示,該公司「在AI開發方面,工具、工作流程和製程方面存在重大差距」,並且需要「在這方面進行大量投資」。

不過,Meta的人工智慧研究部門仍定期發布公開的AI研究論文(不包括社群媒體演算法的AI)。其他AI公司,如Google和OpenAI因競爭而不那麼願意公開研究成果。

Meta執行長馬克.祖克柏就曾表示, 公開研究成果可以讓Meta率先制定AI產品開發的行業標準,並讓外部開發者更好地融入Meta的生態系統 。今年2月,Meta的研究部門與研究人員就開放LLaMA的大型語言模型給AI社群索取使用權限。

LLaMA的能力目前落後於OpenAI最新的GPT4模型以及Google的Bard,但開放資源仍然代表著AI研究社區不須強大的電腦,就可以修改底層程式碼。但這也有專家認為,過於自由的開放可能會遭到惡意使用。

延伸閱讀:Meta要改名成「MetAI」?祖克柏過度沉醉AI世界,分析師發出警告

資料來源:The VergeengadgetVox

責任編輯:林美欣

往下滑看下一篇文章
HiNet 30週年:以 3 個 10 引領台灣數位進化,打造智慧網路未來
HiNet 30週年:以 3 個 10 引領台灣數位進化,打造智慧網路未來

在全球數位浪潮席捲下,網路基礎建設已成為國家競爭力與社會進步的關鍵指標。中華電信HiNet於1995年服務正式商用營運以來,便以台灣數位發展的堅實後盾為目標,持續完善台灣的網路建設。如今正值HiNet服務屆滿30週年之際,中華電信特別舉辦「HiNet 30週年研討會」,以「迎接高速上網 邁向AI智慧科技新世代」為主題,邀請數位發展部次長葉寧、國家通訊傳播委員會委員王怡惠及產官學研各界菁英,共同回顧台灣網路演進軌跡,並聚焦全光網路、AI應用與智慧生活等關鍵議題,勾勒未來智慧時代的網路藍圖。

中華電信HiNet三十週年研討會,聚集齊聚產官學界(由左至右分別為,:中華電信個人家庭分公司總經理胡
中華電信HiNet三十週年研討會,聚集齊聚產官學界(由左至右分別為:中華電信個人家庭分公司總經理胡學海、台灣諾基亞通信公司總經理劉明達、國科會科技政策諮詢專家室主任蔡志宏、國家通訊傳播委員會委員王怡惠、中華電信董事長簡志誠、數位發展部次長葉寧、中華電信總經理林榮賜、DIGITIMES副總經理黃逸平、中華電信網路技術分公司總經理賈仲雍)
圖/ 數位時代

回顧30年歷程,看HiNet網路服務發展的3個10

中華電信董事長簡志誠以3個10來概括HiNet從過去到現在的發展。第一個10是指「30年如一日」的服務理念,從撥接網路時代開始至今,中華電信始終堅持提供最快速度、最好品質與最大涵蓋率的網路服務。

第二個10意味著「十足韌性」,透過整合海纜、光纖、行動網路、微波及低中高軌衛星,打造出海地星空的綿密網路架構,同時全力投入全光網路發展,確保個人、家戶與企業在各種環境下或面對外在各種變化時,皆能享有穩定連網服務。

第三個10則象徵「十分智慧」,中華電信以穩定可靠的網路建設為根基,積極拓展AI應用領域,推出Hami Video、防駭防詐等創新服務,為民眾生活與企業營運注入智慧動能,創造更便捷高效的數位體驗。

中華電信董事長 簡志誠
中華電信董事長 簡志誠
圖/ 數位時代

HiNet 30年,驅動台灣數位服務新未來

中華電信總經理林榮賜以「HiNet 30年:驅動台灣數位服務新未來」為主題進行報告,內容涵蓋HiNet三十年來的發展歷程、技術演進、網路韌性、數位應用推動、資安防護與前瞻佈局。

首先他回顧HiNet連網技術的發展歷程,從市話撥接、ADSL/VDSL寬頻上網、光纖到樓、光纖到府到目前發展中的全光網路,不僅讓骨幹頻寬成長150倍、連外頻寬增加了200倍,更有效縮減城鄉間的數位落差,使山區、偏鄉皆能享有完善的網路服務。這些關鍵建設讓台灣可以緊密連結全球,在數位競爭力與科技整備度等國際評比中始終名列前茅。

在推動台灣網路普及與高速化的過程中,中華電信也不忘與產業共榮共生的理念,藉由在地採購策略及終端設備領域優先選用台灣品牌的做法,讓本土設備商得以藉此機會測試與國際設備的互連能力,累積搶占國際市場的產品競爭力,進而加速台灣資通訊產業的蓬勃發展。

不斷強化網路韌性,提供不中斷的連網服務

除了完善網路基礎建設,中華電信近年來亦積極打造海地星空的網路架構,並導入雲端技術去強化網路韌性,以便更從容的因應極端氣候與地緣政治風險。

林榮賜說明,中華電信在「海地星空」網路架構的布局上不遺餘力,已投資超過30條國際海纜、於偏遠地區建置微波通訊系統,並與One Web、Astranis 等國際衛星通訊業者合作等,透過異質網路架構打造具強大韌性的通訊網路。在雲端技術應用上,中華電信導入網路功能虛擬化(NFV)的機制,將網路服務從硬體中抽離,達到快速延展、隨需部署及異地災備的目標,確保在各種情況下,網路服務仍能維持不中斷,全面強化台灣數位基礎建設的韌性與可靠度。

中華電信總經理 林榮賜
中華電信總經理 林榮賜
圖/ 數位時代

推動數位應用與智慧生活,引領智慧未來

中華電信以穩定可靠的網路建設為基礎,推動HiNet加值應用服務,包括MOD、OTT影音(如Hami Video)、數位音樂(KKBOX)、消費資安、Google One雲端空間及智慧醫療、智慧交通、智慧農業等企客應用,形塑全方位智慧生活生態圈。同時,中華電信也積極投入影視投資與元宇宙應用,推動文化創新,並協助企業數位轉型,例如透過多雲交換平台 CMCX無縫串接三大國際公有雲與中華電信雲平台hicloud,再結合資安、數據等專業顧問服務,協助企業上雲,目前雲與IDC部門已成為中華電信首個營收突破百億元的業務單位。

資安防護與數位信任

面對日益嚴峻的資安威脅及詐騙風險,中華電信建構7x24資安防護體系,不只推出相對應解決方案,從防駭守門員、偵測偽冒網站與國際詐騙電話,到建立多層防線與資安監控機制,全方位守護個人與企業的數位安全,更運用AI阻擋惡意連線、詐騙簡訊與駭客攻擊,2024年成功攔阻威脅數達數十億次,現更推動後量子密碼技術,強化數位信任與資料主權。

國科會科技政策諮詢專家室主任蔡志宏認為,中華電信提供從連網、雲服務、AI應用到資安的完整解決方案,使其在台灣AI發展上扮演著多元且關鍵的角色,加速從政府部門的公共服務AI化到百工百業的AI轉型。

國科會科技政策諮詢專家室主任 蔡志宏
國科會科技政策諮詢專家室主任 蔡志宏
圖/ 數位時代

未來10年,把握,6G、AI和全光網路3大重點

中華電信網路技術分公司總經理賈仲雍於高峰對談時展望未來,他表示6G、全光網路和AI是中華電信的3大發展重心,尤其全光網路高速傳輸的特性,讓企業可以把敏感資料留在地端,同時仍可運用遠端資料中心的GPU進行運算,這種資料與算力資源分離的架構,有效降低企業對資料安全的疑慮,進而提高導入AI的意願。

中華電信獨立董事杜奕瑾則從另一角度闡述全光網路的價值,他指出此技術讓AI不需直接存取原始資料,就能進行跨國、跨企業間的聯邦式學習,大幅提升AI系統的智慧化程度。

台灣諾基亞通信公司總經理劉明達亦建議,中華電信可攜手產業發展垂直產業的AI應用,並積極拓展國際市場,有效掌握未來AI時代的龐大商機。

賈仲雍總經理最終以「穩」、「韌」、「新」、「安」四字精闢總結HiNet未來10年的發展方向,也就是確保網路服務穩定可靠、提升網路韌性、持續引進創新技術及強化上網安全,期望能繼續為台灣寬頻網路建設而努力,讓台灣網路產業在全球數位經濟浪潮中持續發光發熱,共創智慧台灣的美好未來。

走進HiNet時光隧道,體驗AI智慧生活新境界

本次研討會場外精心規劃「HiNet 30週年回顧」與「AI智慧家庭新世代」兩大展區。前者帶領參觀者重溫HiNet三十年來的輝煌歷程,後者為智慧家庭創造無限可能,展區除攜手全球電信設備領導廠商Nokia,率先於國內完成 50G PON高速光纖接取技術及Wi-Fi容器化架構服務驗證,可全面提升家庭網路的速度、穩定性與延展性。展區同時展示智慧家庭應用與消費性資安解決方案,並設有互動問答與導覽模擬體驗,讓參與者能親身感受未來智慧生活的全貌。透過實體展示與沉浸式互動,中華電信不僅彰顯其於網路建設及 AI 應用領域的創新實力,更強化與大眾的溝通連結,展現推動數位轉型的決心與執行力。

HiNet 連網技術不斷追求新的突破,從市話撥接、ADSL/VDSL寬頻上網、光纖到樓、光纖到府到目
HiNet 連網技術不斷追求新的突破,從市話撥接、ADSL/VDSL寬頻上網、光纖到樓、光纖到府到目前發展中的全光網路,強化台灣在國際上的數位競爭力。
圖/ 數位時代

立即收看:《HiNet 30為愛前行的光》主題影片

追蹤我們
電商終局戰
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓