GPT-4新數據來源:100萬小時YT影片!文字已經不夠用了嗎?有違反版權嗎?
GPT-4新數據來源:100萬小時YT影片!文字已經不夠用了嗎?有違反版權嗎?

為了訓練AI,據傳OpenAI把目標指向了YouTube。

根據《紐約時報》的報導,OpenAI對語言模型訓練的素材需求大增,目前網路上的文字內容已經不夠,OpenAI利用語音轉文字工具「Whisper」轉錄了100萬小時的YouTube影片內容來訓練GPT-4。

YouTube變GPT-4新飼料?Google怎麼看?

Google發言人馬特・布萊恩(Matt Bryant)表示對OpenAI的做法一無所知,並且強調禁止「未經授權抓取或下載YouTube內容」。YouTube執行長尼爾.莫漢(Neal Mohan)日前在《彭博社》受訪時提到,目前並沒有證據指出OpenAI違規使用YouTube的影音內容,但若屬實,的確會違反YouTube平台的使用條款。

尼爾.莫漢提到:「從影片創作者的角度來看,創作者將他們辛苦創作的作品上傳到YouTube,一定會有期待受到服務條款的保障。這個服務條款就是: 不允許下載文字記錄或影片片段內容等 。這(指使用YouTube的影音內容來訓練模型)明顯違反了服務條款。」

也就是說,目前還不能證實OpenAI是否真的利用YouTube來訓練AI模型,但似乎也不讓人意外。

為什麼OpenAI、Meta、Google需要這麽多數據?

約翰霍普金斯大學(Johns Hopkins University)理論物理學家賈里德.卡普蘭尼(Jared Kaplany),同時也是AI新創公司Anthropic的創始人之一,在2020時發表的論文指出,語言模型讀取的資料越多,效能就越好。

也就是說,開發大型語言模型(LLM)最重要的環節就是「餵食」AI模型大量的資料。根據《彭博社》報導指出,隨著OpenAI、Google和其他公司競相開發更強大的人工智慧,他們正在尋求更多的資料內容來訓練他們的人工智慧模型,以獲得更好的品質。

研究機構Epoch提到,AI公司使用數據的速度比生成數據的速度還要快。Meta的內部資料中,Meta生成式AI副總裁艾哈邁德.達赫勒(Ahmad Al-Dahle)表示,「除非獲得更多數據,否則Meta無法追趕上OpenAI。」

科技巨頭為了AI數據,正著手修改服務條款

如何取得大量的資料成為大型語言模型公司的發展命脈。研發AI大型語言模型的公司如OpenAI、Google、Meta等公司正透過更改服務條款來取得現有用戶的資料。

《紐約時報》提到,2023年Google曾要求隱私權管理部門擴大使用服務條款,內容是允許Google利用公開的Google文件、Google地圖上的餐廳評論等來訓練開發中的AI語言模型。Meta也於2023年討論收購出版社Simon&Schuster(美國六大出版商之一),以取得長篇作品,並討論從網路上搜集受版權保護的內容。

而Google也表示,其語言模型使用了「部分YouTube影音內容」進行訓練,並取得了影片創作者的許可。

Meta也表示,已經「積極投資」將AI整合到Instagram和Facebook的服務中,並且取得數10億的公開共享圖像和影音來訓練模型。

根據《紐約時報》,目前AI使用網路上的資料訓練,已經使用超過3兆字,大約是牛津大學博德利圖書館(英國第二大的圖書館)的藏書文字的2倍。

你的資料,終究有一天被AI用!如何保護自己?

而當科技巨頭們對數據無限的需求,也引發了許多創作者對於版權問題的疑慮和訴訟。

《紐約時報》去年起訴OpenAI和微軟,稱其在未經許可的情況下使用受版權保護的新聞文章來訓練語言模型。OpenAI和微軟表示,使用這些文章是「合理使用」,是版權法所允許的。

為了解決數據不足的問題,許多語言模型公司正在開發人工智慧生成的文本(合成數據)來訓練AI語言模型,除了減少對於版權資料的依賴,也可以開發出更好的AI模型版本,以提升競爭優勢。

但此合成數據仍然處於爭議階段。使用合成數據來訓練語言模型也可能導致強化語言模型的偏見和錯誤,OpenAI的研發人員表示,這種方法可能會導致語言模型的故障,因此語言模型公司仍在嘗試其他新的做法。

AI database
圖/ <a href="https://www.freepik.com/free-photo/ai-mac

在找到更好的方法之前,想必各家科技巨頭還會持續想出獲取數據的方式,換個角度說,在「數據量大等於好」的前提沒有破解前,數據戰爭還會持續下去。

延伸閱讀:聯發科推出台版ChatGPT!最懂繁體中文的「達哥」有多厲害?

資料來源:The New York TimesThe Wall Street JournalBloomberg

責任編輯:林美欣

往下滑看下一篇文章
永豐「DAWHO × 大戶投」銀證整合 ,三大策略啟動生活金融新時代
永豐「DAWHO × 大戶投」銀證整合 ,三大策略啟動生活金融新時代

數位金融競爭白熱化,永豐不光只是比利率與回饋,今(2026)年開始從「使用者需求」重新定義服務。永豐銀數位帳戶DAWHO推出上市即引發話題,第3年達成損益兩平、第4年開始獲利,至2025年9月底戶數突破211萬。永豐金證券則以自建交易平台「大戶投APP」累積近百萬次下載量,持續深耕投資科技。如今,永豐透過「DAWHO × 大戶投」銀證整合,正在以三大策略打造一站式生活金融體驗,要陪伴客戶從儲蓄、消費到投資、走出一條屬於客戶的財富成長路徑。

數位帳戶不是新服務,當多數銀行仍將焦點放在利率、回饋與開戶規模,永豐選擇從使用者需求出發,重新思考、設計與推出數位金融服務,讓 DAWHO 得以在高度同質化的市場中後發先至,持續推出貼近實際生活場景的數位金融服務體驗。

永豐銀行副總經理暨數位金融處處長嚴國瑞表示:「我們從一開始就設定清楚目標,要用DAWHO(Digital Account With Happiness Openness)打破只有高資產客戶才能享有完整金融服務的既定印象,讓年輕世代也可以享受『豐裕快樂』且備受尊重的金融服務。」隨著客戶年齡與資產結構逐步轉變,永豐將透過 DAWHO 數位生態圈以更細緻的服務滿足 25 至 40 歲亨利族(HENRYs;High Earner, Not Rich Yet)的需求,引領客戶逐步將資產放大。

20251210-62.jpg
永豐銀行副總經理暨數位金融處處長嚴國瑞
圖/ 數位時代

開戶到投資一站完成,永豐「DAWHO × 大戶投」銀證整合推進生活金融

永豐整合銀行與證券帳戶,推出「DAWHO × 大戶投」,讓客戶可以在線上一次完成新臺幣、外幣、信託,以及國內證券與複委託帳戶的開立,省去重複填寫資料、跨機構審核、多次等待的時間,將過往分散、繁瑣的流程,整合為直覺、便利的一站式體驗。「銀證整合」下,在銀行DAWHO APP可輕鬆查看證券台股與複委託庫存,一眼掌握銀證投資分布;在證券大戶投APP,也可以清楚查看銀行餘額與近14日明細,評估交割金額是否足夠,免去切換平台的煩惱。

透過「DAWHO × 大戶投」的持續優化,串聯起儲蓄、消費、投資正三角的美好生活。為了實踐 DAWHO 願景,永豐的第二步是把儲蓄、消費、投資串成一個正三角的生活金融服務。客戶可以將刷卡回饋直接存入DAWHO 數位帳戶,再透過大戶投進行投資,讓日常消費自然銜接到長期理財,把最直覺的刷卡回饋變成「有紀律的資產累積」。

永豐金證券副總經理暨數位金融處處長劉柏甫表示:「我們希望讓投資成為生活的一部分,而不是高門檻的專業行為。」因此,團隊不僅提供貼近日常、低門檻的理財商品,也將證券交易工具「大戶投APP」,打造成引導新手投資人建立投資觀念的平台。

例如投資新手容易入門的股票申購,於今年重磅推出的「智慧申購」功能,使用者只要透過「大戶投APP」預先設定申購條件,並於交割帳戶內保留足額圈存款項,系統便會在符合條件時,自動代為執行新股抽籤,功能可連續運作達三個月不中斷,助投資人參與新股市場更便捷、更高效,不再錯過申購良機。

20251210-69.jpg
永豐金證券副總經理暨數位金融處處長劉柏甫
圖/ 數位時代

讓投資科技賦能 永豐「DAWHO × 大戶投」以創新服務擴大普惠金融

第三步是透過智慧化技術提供客戶所需的普惠金融服務、持續完善永豐 DAWHO 數位金融生態圈。例如,永豐銀行於 2019年推出智能理財服務「永豐 ibrAin」,打破傳統複委託大額投資的限制、讓年輕族群與小資族可以低門檻(新臺幣1,000元起)、高度自動化的方式進行全球 ETF 定期定額投資,降低參與全球資產配置的門檻。另一方面,若投資人已擁有自己喜好的投資標的,則可以利用永豐金證券存股平台,除了享低門檻定期定額申購服務,也提供業界首創的「美股股利再投入」自動化服務。

「2025 年初獲金管會核准上線的『股票禮品卡』服務,也是響應普惠金融而生的全台獨創應用。」劉柏甫指出,團隊觀察到愈來愈多民眾希望以金融商品取代現金紅包,在滿月、年節或畢業等重要時刻傳遞祝福外,還能多賦予傳承財富累積的價值觀,因此推出百元面額、人人可負擔的股票禮品卡,讓投資成為日常送禮的選項。
值得特別一提的是,股票禮品卡不僅僅是一張「卡片」,而是可以直接導向投資行動,可用來扣抵存股平台購買股票的手續費、與證券交割款,將「送禮」轉換成「啟動投資」的第一步。

分群經營深度留客 陪伴客戶累積長期財富

從銀證整合、生活金融到智慧化服務,永豐銀行與永豐金證券的核心目標,始終是陪伴客戶,讓客戶可以隨著使用的時間增加,逐步放大財富成為「大戶」;也因此,2026 年永豐DAWHO在既有「大大」與「大戶」分級之外,新增「大戶 Plus」等級,回應資產成長型客戶的進階需求。

嚴國瑞副總經理表示,平均財富達百萬元,且單筆換匯新臺幣五仟元以上,或以DAWHO綁定為永豐金證券交割戶,買入一筆證券台股現貨交易成交(含豐存股)的客戶,即可成為「大戶 Plus」,享每月跨行提款或轉帳共30 次免手續費禮遇、DAWHO 現金回饋信用卡消費最高 6% 現金回饋等優惠,同時還享有訂閱制知識學習平台—豐學 Prime 2.0 30天的免費體驗,以基礎的投資觀念、理財小技巧等實用理財知識,協助投資人強化基礎理財觀念與風險管理能力。

20251210-98.jpg
圖/ 數位時代

展望未來,永豐銀行與永豐金證券除持續深化既有服務外,將持續舉辦DAWHO × 大戶投相關活動,DAWHO APP也將推出外幣新功能,及導入更多個人化智慧服務,藉此降低資訊落差、強化金融教育,打造能真正提升大眾財務韌性的整合式數位金融平台。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓