讓機器自己挑「對」資料樣本!Google雲端AI掌門人李飛飛發表機器學習新模型
讓機器自己挑「對」資料樣本!Google雲端AI掌門人李飛飛發表機器學習新模型
2017.06.19 | 人物

這項研究是李飛飛團隊在今年CVPR上的一項最新工作,該方法提出了一種模型可自動標註網路中巨量的嘈雜影片。

5940cb3da797e.jpeg
圖/ 雷鋒網

以下內容是雷鋒網AI科技評論根據論文內容進行的部分編譯。

論文摘要

人類行為種類多樣,要如何才能讓機器理解具有多樣化和細粒度的人類行為,則是電腦視覺領域中的一個關鍵性的開放問題。透過手工的方式標註訓練影片,對於少數的動作類型是可行的,但是這種策略無法完整覆蓋豐富多樣的所有動作。

螢幕快照 2017-06-19 下午2.47.13.png
圖一。
圖/ 數位時代

圖一,該論文中的模型使用一組標註數據來學習如何為新的、沒有見過的動作類別進行標註的策略。這樣可以學習特定領域的專有知識,以及如何在避免語義漂移(Semantic drift)的同時選擇不同的範例。比如,該模型可以從訓練數據中進行學習,如圖所示,其中人的動作線索對正確動作分類的幫助更大(例如「騎馬」),而不是動物的外形。在測試期間,這種知識可以被應用於標記一些全新類別的嘈雜數據,例如「飼養動物」,而 傳統的半監督方法則是基於視覺相似(Visual similarity)性進行標註。

當前,解決這一個問題的一個可能有效的策略是,使用半監督(Semi-supervised)或者「網路監督(Webly-supervised)」的方法,利用來自網路檢索所產生的嘈雜數據來學習新的動作。然而,這些方法通常無法學習到特定領域的知識(Domain-specific knowledge),或者依賴於需要不斷迭代的手工調整的數據標籤策略(Hand-tuned data labeling policies)。據雷鋒網了解在這項研究中,李飛飛她們團隊提出了一種基於增強學習 (Reinforcement learning-based)的方法, 該方法能夠從嘈雜的網路檢索結果中篩選出適合於訓練分類器的樣本。

螢幕快照 2017-06-19 下午2.47.33.png
圖二。
圖/ 數位時代

圖二,模型框架圖。該模型使用從網路搜索所得的候選示例集,為特定的視覺概念學習分類器。在每一個時間節距(time step)t,模型透過Q-learning的智慧體來選擇樣本(比如 DK),並將該樣本加入到已經存在的正樣本數據集 Dt-1 中構成訓練樣本。然後該訓練樣本被用於訓練視覺分類器。分類器將同時更新智慧體的狀態 st+1 並提供一個獎勵 rt。然後在測試期間,經過訓練的智慧體能夠用於從任意的、全新的視覺概念的網路檢索結果中,自動選取出正樣本。

該方法的核心思想是,使用Q-learning來學習一個小型標籤訓練數據上的數據標籤策略,然後再利用該模型來自動標註嘈雜的網路數據,以獲得新的視覺概念。

據雷鋒網了解,為了驗證該方法,研究員們在當前最富有挑戰性的動作識別數據集Sports-1M上進行了實驗,實驗內容包括動作識別基準、細粒度和新動作類別預測。透過實驗證明了該方法能夠為嘈雜數據學習到足夠好的標籤,並且使用這些標籤能夠學習到準確的視覺概念分類器。

原文刊載於雷鋒網,標題為 〈李飛飛協同斯坦福、CMU 帶來全新成果:從網絡嘈雜的視頻中進行學習),《數位時代》獲授權轉載。
Via Learning to Learn from Noisy Web Videos

李飛飛小檔案
出生:1976年
現職:Google雲端人工智慧暨機器學習首席科學家
經歷:史丹佛人工智慧實驗室主任、史丹佛視覺實驗室主任、豐田-史丹佛人工智慧研究中心負責人
學歷:加州理工大學電機工程博士、普林斯頓大學物理系
成績:ImageNet、Caltech 101、2014 IBM Faculty Fellow Award、2011 Alfred Sloan Faculty Award、2012 Yahoo Labs FREP award

往下滑看下一篇文章
從會員數據到 AI 行銷:Vpon 打造零售業 AI-Ready 數據中台,提升決策效率
從會員數據到 AI 行銷:Vpon 打造零售業 AI-Ready 數據中台,提升決策效率

在 AI 快速進入企業營運核心的時代,數據不再只是被動的分析素材,而是 AI 模型運作與決策優化的重要基礎。

零售品牌積極累積大量第一方數據,例如會員資料、交易紀錄以及線上與線下行為數據,但因這些數據分散於不同系統,缺乏統一的身分識別機制以及明確的元數據(Metadata)定義,導致難以整合與分析,同時,也影響 AI 對這些數據資產的理解與應用。

為解決上述挑戰,Vpon 威朋將累積十餘年的實務經驗轉化為產品與服務,如 Audience Center 與 AI Agent 等解決方案,並透過專業顧問團隊協助企業完成數據收集、清理、整合與分析等關鍵流程,從資料清理到 AI-Ready 再到落地應用,讓行銷與業務團隊能以自然語言將數據查詢與分群受眾逐步自動化,大幅縮短過去仰賴技術與分析團隊溝通需求與開發分析邏輯的時間。

Vpon 助零售業打造 AI-Ready 數據基礎,以 Audience Center 驅動業務商機

如何建立 AI Ready 數據基礎建設?

Vpon 威朋數據科學經理廖宜楷指出,在 AI 驅動的時代,數據的品質決定模型價值。其中四個關鍵分別是:建構標準化的數據採集與處理管線,透過統一的工程規範,確保所有進入系統的數據在格式、維度與質量上具備高度一致性;其次是定義語義清晰的元數據(Metadata)體系,確保數據能夠被 AI 理解與使用,從而產出具備可靠性的產出結果;再來是打破企業內部的「數據孤島」, 透過完整整合線上(Web/App)行為與線下(POS/CRM)會員資訊,建構全方位的會員數據輪廓,精準捕捉消費者的跨通路行為軌跡。最後,數據的價值隨時間遞減,AI 的決策品質取決於數據的「新鮮度」,因此,數據的持續更新與自動化維護,不僅能讓企業在動態市場中保持敏銳,還可進一步深化會員輪廓分析的即時性。

舉例來說,在 Vpon 團隊的協助下,台灣百貨零售龍頭透過整合 Web 與 App 行為資料,並將線上與線下數據集中於數據中台進行分析,將傳統耗時數小時的複雜資料庫分析工作縮短至秒級回應,並基於此高效率基礎,進一步開發不同業務主題的預測與分群模型,提升行銷精準度與營運決策的敏捷性。

扎實數據基礎的價值落實:Audience Center 如何賦能企業實現「數據即戰力」?

有了堅實的數據底座後,下一步是透過 Audience Center 將數據資產轉化為商業動能。

廖宜楷指出,在變化快速的零售與數位行銷市場中,速度就是競爭力。然而,仍有許多企業在數據應用上面臨嚴重的溝通與技術斷層。過去,當行銷或業務人員需要數據支持時,通常得花費繁複的內部流程申請需求、討論需求,才會進到後續的資料清理、建模與分析,最後才能得到想要的分析結果或行銷名單。這種以「週」為單位的進程,不僅拖慢了決策效率,更讓企業在競爭激烈的市場中錯失先機。

Audience Center 的核心價值在於徹底翻轉上述流程,將數據處理轉化為數據服務,透過直覺的介面與背後扎實的數據基礎支撐,讓非技術人員不用編寫程式碼,即可自行組合維度,大幅縮短從需求到執行的距離,將原先需要耗時數週的作業流程優化成秒級產出。

「Audience Center 的導入,不僅有助於提升效率,更賦予企業快速試錯與精準捕獲趨勢的能力,讓數據真正成為驅動業務增長的引擎。」廖宜楷如此總結。

#1 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋數據科學經理 廖宜楷
圖/ 數位時代

以 AI Agent 重塑數據使用方式,讓數據更貼近決策流程

「Vpon 除提供 Audience Center 協助品牌發揮第一方數據資產價值、提供豐沛的第三方數據助品牌深化對客戶輪廓的掌握度,更推出 AI Agent 服務讓品牌與行銷人員能更直覺地使用數據。」Vpon 威朋數據科學資深總監陳文謙表示,在數位轉型的過程中,許多企業面臨的挑戰不僅是數據整合,更包括如何讓不同部門的人員都能更即時協作與應用數據,有鑑於此,Vpon 推出四種 AI Agent 協助企業分析與應用數據,極大化第三方數據成效:

第一,以 Reporting Agent 讓高階主管或行銷人員可以自然語言查詢數據與生成報表,即時掌握市場動態,加速決策下達與決策品質。

第二,透過 Insight Agent 確保數據分析不受分析人員的主觀意識或產業知識侷限,可以輕鬆完成跨領域數據分析、快速挖掘潛在市場機會與消費者洞察。

第三,藉由 Audience Agent 將客戶分群方式從規則導向(Rule-based)轉變為關聯導向,以關聯分析擴大受眾範圍,協助品牌找出更多潛在客群。

第四,推出 Creative Agent 協助行銷人員分析廣告素材表現的根本原因,釐清受眾喜歡的素材跟不喜歡的素材,藉此優化廣告投放內容,持續提升轉換率。

陳文謙表示:「透過 AI Agent 的輔助,品牌不僅能更快完成數據分析,也能將分析結果直接轉化為行銷策略與創意建議,降低跨部門溝通成本,讓數據真正參與決策流程。」

#2 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋數據科學資深總監 陳文謙
圖/ 數位時代

鏈結數據生態夥伴,以跨境數據放大行銷效益

除了協助品牌主建立 AI Ready 的數據基礎環境並提升數據使用效率,Vpon 也持續拓展數據生態圈,協助零售品牌更精準布局海外市場。

Vpon 威朋產品行銷資深經理邱心儒表示,跨境行銷過去多仰賴經驗與市場直覺,但透過數據整合與 AI 分析,品牌能更精準理解海外消費者的旅遊與消費行為。

以 Vpon 與日本 Loyalty Marketing Inc. 合作為例說明,透過雙方的獨家合作,企業可以結合 Ponta 超過一億的會員數據、問卷調查結果以及 Vpon 的七大數據來源,深入分析日本消費者的消費偏好與購買力——包括哪些日本族群對台灣品牌最感興趣、最受歡迎的台灣商品類型,以及不同客群的價格敏感度與回購行為等,將行銷決策從過往的經驗判斷轉變為精準的數據洞察,成為品牌出海的重要工具。

簡言之,對零售品牌而言,跨境數據是理解海外旅客真實樣貌的一大利器,也能進一步優化廣告投放、內容策略與商品布局,讓品牌在拓展國際市場時,可以更有效率地接觸潛在客群,放大行銷效益。

#3 從會員數據到AI行銷:Vpon打造零售業AI-Ready數據中台,提升決策效率
Vpon 威朋產品行銷資深經理 邱心儒
圖/ 數位時代

展望未來,Vpon 將持續擴展數據生態圈並優化產品服務,幫助零售品牌從數據整合、AI 分析到市場決策建立完整的數據應用循環,希望以數據夥伴的角色與品牌共同成長,打造互利共贏的數據生態。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓