Meta二代「SAM 2」來了!AI一鍵分割影片中物件,還免費讓外界開源,祖克柏有何野心?
Meta二代「SAM 2」來了!AI一鍵分割影片中物件,還免費讓外界開源,祖克柏有何野心?

去年Meta推出能夠分割圖像的Segment Anything模型大受外界好評,相隔一年後的現在,Meta帶來了第二代Segment Anything模型(後稱SAM 2),加入了辨識影像中各個物體的技術,並且免費開放所有人使用。

Meta提到的「分割」指的是,AI模型辨別圖像中的各個要素,並將其獨立出來,好比說一段運球的影片中,AI能夠知道籃球是籃球,球員是球員,籃球並不是球員身體的一部分,並將各個物體分割出來。這項技術能夠用於科學研究或編輯照片,依照Meta透露的資訊,目前SAM已應用在分析珊瑚礁、救災圖像、檢測癌症等眾多面向上。

用最大資料集煉成,靠「單幀」分割影片物體

而現在最新發表的SAM 2,主要更新是將這些功能拓展到了影像裡。Meta強調,影像中分割遠比圖像困難,因為物體的位置會隨時間快速變化、過程中可能被遮擋或形狀改變,這都加劇了分割的難度。

不過Meta在部落格中提到,一張圖像可以被視為僅具有單幀(frame)的極短影片,他們便是從這個角度切入來開發新模型。在影片中分割的唯一差別在於,模型需要依靠記憶體回憶起該影片之前處理過的資訊,好在當下時間準備分割物體。

且要實現影像中分割自然需要經過大量訓練,在發表SAM 2的同時,Meta也開放了有著超
過5萬部影片的標注資料集SA-V,並包含超過60萬個時空遮罩(Masklet)。時空遮罩會標注物體的時間及位置,是現有最大影像分割資料集的53倍大。

且根據《TechCrunch》報導,Meta還在論文中提到訓練材料包括一個著10萬部影片的內部資料集並推測可能來自Instagram和Facebook上的公開資料。

近日廣受矚目的祖克柏與輝達執行長黃仁勳在SIGGRAPH 2024活動上對談,就提到了新推出的SAM 2。「科學家利用這項技術來研究珊瑚礁、自然棲息地之類的東西,不過能將這項技術應用到影片,並且在沒有樣本提示的情況下告訴它你想要的,這真的非常酷。」祖克柏表示。

黃仁勳 祖克柏 01.jpg
祖克柏與輝達執行長黃仁勳的對談中,也提到了他們新推出的模型。
圖/ 輝達YouTube頻道

《TechCrunch》指出,雖然處理影片需要更龐大的運算能力,使得SAM 2有更高的硬體要求,但在Meta推出這系列模型前,想要如此迅速、靈活的分割影像中的物體根本不可能辦得到。

不過Meta表示,SAM 2仍有一些缺憾,在較為複雜的場景中很難持續鎖定要分割的物體,例如多隻馬一齊狂奔的影片中,SAM 2會在中途失去鎖定,需要人為手動校正;又或者同時分割多個物體時效率會大大降低,未來還有改進的空間。

SAM 2仍免費開源使用,祖克柏目的打造更完備模型

不過如此具有突破的模型,Meta仍然免費開放所有人使用,在Apache 2.0授權條款下發布這款新模型。

Meta強調,他們鼓勵AI社群嘗試使用這次的新模型、使用他們的資料集並希望透過分享這個研究,為圖像分割及相關領域的發展做出貢獻,並期待這次分享能激發社群產生新的見解、帶來有幫助的經驗。

meta SAM 2 02.jpg
透過SAM 2,AI能夠將影片中的不同物體分割、獨立出來。
圖/ Meta

Meta近年在AI領域的發展,一直堅定擁護開源開放的路線。祖克柏也提到,雖然Meta的開放並不是全然是出於做功德的心態,但不代表他們別有居心,「你需要圍繞它的生態系統,如果我們不開源這些功能就不會這麼好用,沒錯吧?我們選擇開源並不是因為我們大公無私,而是認為這麼做可以讓我們打造的東西變得最棒。」

就在發表SAM 2的前一週,祖克柏撰寫了一封公開信,透露他們正努力使開源成為AI領域的產業標準,強調這項技術比其他任何技術都有潛力提昇人類的生產力、創造力及生活品質,為社會及科學的革新帶來貢獻。Meta聲稱去年推出SAM後在AI社群帶來的迴響令他們印象深刻,預計SAM 2將帶來更為令人興奮的可能性。

延伸閱讀:首批iPhone 16恐不含AI功能!蘋果擬推遲Apple Intelligence上線,問題出在哪?
詐騙靠Deepfake語音假扮CEO!法拉利高管險遭設局,他如何靠「1句反問」化解危機?

資料來源:TechCrunchMeta(1)Meta(2)

責任編輯:蘇柔瑋

關鍵字: #meta
往下滑看下一篇文章
帳戶安全再升級!國泰世華銀行攜手國泰產險以科技與保險打造新世代數位防衛陣線
帳戶安全再升級!國泰世華銀行攜手國泰產險以科技與保險打造新世代數位防衛陣線

根據金融監督管理委員會公布的數據資料,截至2024年底,台灣數位存款帳戶的開立數量突破2,446萬戶,較2023年(1,968.6萬戶)增加24.3%,超越了總人口數,與此同時,帳戶安全也面臨前所未見的挑戰。

國泰世華銀行作為台灣金融領導品牌,不僅提供用戶導向的便捷安全金融服務體驗,透過先進技術杜絕駭客、釣魚攻擊風險,同時,以全方位CUBE App 帳戶安全健檢機制搭配跨界創新推出的「帳戶安全險」,打造從「預防」到「關懷」的數位金融安全。

國泰世華銀行攜手國泰產險,以帳戶安全健檢與帳戶安全險雙引擎竭盡保障金融安全

隨著數位金融普及成為你我日常生活的一部份,詐騙集團或駭客以各種方式發動攻擊,如釣魚簡訊、木馬程式竊取帳密、假網站盜取信用卡資訊,或者是假冒官方機構的社交工程…等,因此,無論是登入金融帳戶、轉帳、消費,還是投資理財,民眾除要有資安防護意識,金融機構提供的科技防護也是重要防線。

國泰世華銀行領先市場推出的CUBE App 帳戶安全健檢服務,從登入安全、交易安全、個資安全與系統安全…等四個面向提醒用戶須注意的地方,包含登入兩步驟驗證、FIDO快速登入、裝置綁定、交易認證碼、人臉辨識驗證交易、交易推播通知、Email/手機號碼檢核、App版本、手機作業系統…等項目,完成CUBE App 帳戶安全健檢設定,即可再強化帳戶安全的防護等級。國泰世華銀行對於數位安全不斷突破創新,此次攜手跨界夥伴–國泰產險推出「帳戶安全險」活動,用戶若完成10項安全健檢設定,並至CUBE App保險專區點選參加帳戶安全險活動,即有可能獲得最高新臺幣16,000元的理賠保障(限額45,000名)。(詳細保障內容依國泰世華銀行官網為準,可至活動專頁查詢。)

登入、交易、個資、系統等四層面十大安全健檢項目
登入、交易、個資、系統等四層面十大安全健檢項目
圖/ 國泰世華銀行

根據用戶動態提供主動防禦與提示,阻擋盜用、詐騙潛在風險

除從帳戶安全出發,國泰世華銀行更因應消費者使用行為,以多項主動防禦與智能提示機制保障交易前、中、後安全,讓安全防護不再是被動防禦,而是隨時偵測、即時反應:例如,透過「登入兩步驟驗證」等方式強化登入安全,運作概念就像是Google帳號的雙重驗證機制,當陌生裝置嘗試登入CUBE App帳戶時,系統會即時發出第二道OTP驗證來確認登入者身分,大幅提升登入安全。其次,用戶還可透過CUBE App啟動、人臉辨識驗證與交易認證碼…等多元交易驗證機制,並且綁定裝置才可使用,大幅保障交易安全。

除了前述安全機制,CUBE App還有提供「卡片安全鎖」服務,可依照交易地區、交易類型、交易時間與單筆交易金額上限進行個別設定,讓用戶根據自身需求,靈活控管用卡範圍。而針對風險與頻率日益攀升的釣魚簡訊詐欺事件,CUBE App也有「簡訊收件匣」提供客戶確認簡訊來源,若收到疑似詐騙簡訊客戶能直接開啟CUBE App登入後查詢簡訊內容,讓用戶可以一眼辨識訊息來源,杜絕偽冒門號發送的詐騙簡訊。

持續與時俱進推升數位安全防護

從全方位的 CUBE App 帳戶安全健檢、業界首創的帳戶安全險,到全面覆蓋交易前中後的進階防護機制,國泰世華銀行始終以用戶需求為出發點,結合跨界創新,不斷推升金融科技的安全標準。未來,將持續進化安全防護策略、精準因應各種場景挑戰,以高規格守護每一位用戶的資產安全,讓用戶可以安心享受智慧金融生活。

本文係由國泰世華銀行邀約,產險商品由國泰產險提供

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣50
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓