因為14萬筆AI語料訓練資料,中央社提告台大生!AI訓練在台灣遇到什麼難題?
因為14萬筆AI語料訓練資料,中央社提告台大生!AI訓練在台灣遇到什麼難題?

台大博士生分享的繁體中文資料集遭《中央社》提告,因其包含未經授權的新聞內容。此事件引發關於AI訓練資料著作權爭議,有網友認為《中央社》不該提告博士生,而是最上游的開源平台與爬蟲者。

台大博士生做繁中資料集供AI訓練,遭中央社提告

一位台灣大學博士生、開源志工,在數個月前於 Facebook 的「Generative AI 技術交流中心」社團分享了繁體中文資料集(fineweb-zhtw),如今卻收到檢調寄信通知,原來資料集中包含台灣官方媒體《中央社》的大量新聞報導資料,並已被該媒體提起刑事告訴。

根據《中央社》7 月 7 日發表的聲明,該資料集包含自 2011 年至 2021 年止、約 14 萬筆來自中央社的新聞內容,而這些內容從未獲得該媒體授權。

這位博士生在事件曝光後,已將原本分享的繁體中文資料集貼文刪除,並公開表示會配合檢調調查,目前也將 Facebook 個人檔案鎖上。

中央社:身分不詳才提告,維護新聞產業著作權

《中央社》表示,對於未經授權大量使用該社新聞內容的公司或個人,一向秉持維護著作權的立場,會儘可能取得聯繫要求下架。但本次事件是因為「該公開者之身分資訊不詳」,基於維護權益目的才提起刑事告訴。

該社強調,新聞報導均來自第一線記者採訪整理,有些是經授權的外電消息再由編輯團隊翻譯撰寫,每一則新聞都是記者與編輯的心血結晶。

《中央社》也表示支持《媒體議價法》的推動,盼能與數位平台建立公平合作模式,為台灣媒體環境注入正循環。

中央社提告分享含有未經授權內容繁體中文資料集的台大博士生

中央社應該告誰? Hugging Face V.S 台大博士生

《中央社》在聲明中表達強烈捍衛新聞著作權的立場,但引發網友強烈反彈。

有網友指出,《中央社》應該去告最上游的 Common Crawl,這是國外一個大型公開的網路爬蟲專案,從 2008 年就開始運作,可能早已未經授權爬到了不少台灣媒體報導內容,而不是只針對下游整理和清理資料的台灣博士生提告,因為各家大語言模型包括 OpenAI ChatGPT、Google Gemini、Meta Llama 等都使用 Common Crawl 來訓練模型。

另有網友批評此舉荒謬,認為真正的訴訟對象應該是 Hugging Face,也就是這位台大博士生採用的開源 AI 平台,而非使用資料的台大博士生本身,更有網友痛批:「作為國家通訊社,理應優先維護台灣權益,卻先向自己人開刀,難免令人遺憾。」

不過也有網友支持中央社行使權利,認為目前 AI 訓練市場中,缺乏繁中資料、繁中主權模型、新創等理由,不能當作是作為剝削他人創作內容的藉口。即使是非營利的 AI 訓練用途,也應該經過著作權持有者同意。

數發部:AI訓練陷兩難,正籌備台灣AI語料庫

數位發展部政務次長林宜敬 在《中央社》聲明前,曾針對此事發表看法,認為這是數發部面臨的兩難。

一方面希望保護台灣媒體業與出版業著作權,另一方面又希望民主國家科學家能方便取得具備台灣觀點的中文資料,訓練出具備台灣觀點的 AI 模型。

林宜敬指出,美國科學家會使用大量簡體中文資料訓練 AI 模型,部分原因是中國向來不注重著作權,使用來自中國的簡體中文資料不會有侵犯著作權風險。

而台灣繁體中文資料不但量少,還有著作權風險。因此數發部正積極籌劃《台灣主權 AI 訓練語料庫》,讓世界各民主國家都能安心使用繁體中文資料訓練 AI 模型。

數發部政務次長談中央社提告繁體中文資料集提供者爭議

不過,在數發部的台灣 AI 語料庫正式出爐前,個人使用含有未經授權的繁體中文著作權內容,來製作 AI 訓練資料集,可能仍有法律風險。在生成式 AI 技術快速發展的同時,如何平衡創新與智慧財產權保護,仍是各界需要共同面對的挑戰。

本文授權轉載自《加密城市》,作者:Ariel,原文標題:台大生做繁中資料集給AI遭中央社提告!官媒遭噴:只向自己人開刀

往下滑看下一篇文章
AI 改寫外貿規則!Alibaba.com 用 AI 助台灣中小企業提升跨境獲客力
AI 改寫外貿規則!Alibaba.com 用 AI 助台灣中小企業提升跨境獲客力

過去談外貿競爭力,企業多半聚焦在產品品質、價格優勢與業務能力,但在 AI 新世代,外貿經營模式開始改變,從搜尋供應商、產品比價,到詢價與下單,越來越多流程倚靠 AI 優化與處理,企業若無法善用 AI 工具,接單效率跟市場競爭力都將逐漸落後。

在這樣的趨勢下,全球 B2B 跨境電商平台 Alibaba.com 持續以 AI 強化平台能力,並透過在地團隊與服務體系,協助台灣中小企業提升跨境營運效率與訂單轉換率,同時,每年皆舉辦「跨境電商達人賽」,今年遴選出 10 家台灣代表企業,展示 AI 如何協助企業提升外貿接單能力並拓展海外市場。

例如,深耕五金泵浦領域 40 餘年、積極將產品服務延伸至消防系統與節能設備的偉盛豐貿易,便透過 Alibaba.com 與 AI 生意助手自動回覆海外買家的 RFQ 詢盤,突破時差限制,讓接單流程更加即時,成功將市場拓展至美國、義大利與新加坡等地。

解決客戶痛點,Alibaba.com 以 AI 外貿金三角助台灣企業提升跨境接單力

受到貿易戰與地緣政治影響,全球貿易環境的不確定性大幅提升,過度依賴單一市場已成為潛在風險,越來越多企業透過提供多元產品與布局多元市場確保營運韌性、台灣中小企業也不例外。只不過,受到開發新市場成本高昂、優秀外貿人才逐漸流向半導體與科技產業等因素影響,中小企業面臨諸多挑戰。

為協助企業解決這些痛點,Alibaba.com 台灣總經理廖羿琦表示:「Alibaba.com 不只提供『一站通全球』平台,也透過一系列 AI 與數據工具,幫助台灣賣家更有效率地將產品銷往歐美與東南亞市場,讓 MIT 產品被更多全球買家看見。」

廖羿琦進一步指出,跨境電商從店鋪開設、商品上架、產品描述、回覆買家需求,到成交後的金流與物流,每個環節都影響接單效率,因此,Alibaba.com 提出 AI 外貿金三角策略,協助台灣中小企業系統化提升跨境接單能力:

首先,是透過 Alibaba.com 的一站式外貿平台,連結全球超過 190多個國家和地區、超過5000 萬活躍買家,並提供 AI 工具協助商家提升營運效率。例如,AI 生意助手可協助分析不同市場熱銷商品,提供商品標題與關鍵字建議,甚至生成產品場景圖與影片,提高商品在全球市場的曝光度。

其次,透過 OKKI CRM 協助台灣商家深入理解與客戶的互動關係與需求變化,進而精準地預測客戶需求,挖掘潛在商機。

最後,透過 OKKI AiReach 協助企業從被動接單轉為主動開發客戶。廖羿琦指出:「企業可以透過 AiReach 盤點產業上下游的關聯圖譜與企業關係,讓商家透過更精準的 eDM 與客戶接觸,進一步提升陌生開發的轉換率與成交率。」

值得特別一提的是,除了平台工具,Alibaba.com 也持續強化與企業社群的連結。例如在台灣北、中、南設立六個商圈,透過交流活動讓商家分享跨境經驗與市場洞察,同時也有專職團隊協助企業導入平台與 AI 工具,加速跨境電商的營運成長。

#0 AI 改寫外貿規則!Alibaba.com 用 AI 助台灣中小企業提升跨境獲客力
Alibaba.com 台灣總經理 廖羿琦
圖/ 數位時代

高效佈局,偉盛豐貿易以 Alibaba.com 成功擴展外貿市場

偉盛豐貿易長期深耕泵用閥件與 DC 循環扇市場,隨著第二代接班,公司也開始面臨新的經營課題:疫情衝擊全球供應鏈、台灣內銷市場逐漸飽和,加上通膨、貿易戰與地緣政治等因素,使企業必須重新思考成長動能。

為尋找新的營收來源,偉盛豐貿易王珮馨決定積極布局外貿市場,目標是直接與海外企業客戶建立合作關係,進一步掌握市場需求與訂單結構。

偉盛豐貿易一開始是透過參加國際展會拓展海外市場,但成本高、效益有限。「直到加入 Alibaba.com 後,才真正打開跨境市場。」王珮馨表示,短短一年的時間,偉盛豐貿易與來自美國、義大利與新加坡等六個國家的客戶建立合作關係,甚至在產品單價高於同業約七倍的情況下,仍成功拿下義大利與美國的貨櫃訂單。

背後的關鍵之一,是 Alibaba.com 提供的 AI 生意助手。她表示:「將產品知識庫與技術資料導入 AI 生意助手後,系統便能依照產品規格與應用場景,自動回覆海外買家的 RFQ 詢盤,就算我在休息的時候,AI 仍在替公司接單,而且是用客戶熟悉的語言回覆,等到我隔天上班後再接手處理客戶的進階問題,整體接單效率大幅提升。」

例如,面對美國芝加哥並重視ESG議題的客戶詢問:為何偉盛豐提供的 2.9W DC 循環扇售價高達 156 美元、幾乎是市售產品的七倍,王珮馨的做法是先查詢芝加哥的電價資料,再透過 AI 生意助手生成產品應用場景圖與競品耗電分析表,從「整體持有成本(TCO)」角度說明產品節能優勢,成功說服客戶,取得40呎貨櫃訂單。

王珮馨說:「至於來自義大利的食品加工廠客戶,也是因為 AI 生意助手即時回覆產品規格,了解我們提供的泵浦閥門可在不更動既有設備管線的情況下直接替換使用,因此決定採用該產品並建立長期合作。」對偉盛豐而言,AI 生意助手不只是平台工具,更像是全天候運作的「跨境電商店長」,不僅降低外貿經營門檻,也有益於偉盛豐貿易將隱形冠軍產品推向全球市場。

#0 AI 改寫外貿規則!Alibaba.com 用 AI 助台灣中小企業提升跨境獲客力
偉盛豐貿易 王珮馨
圖/ 數位時代

善用 AI 工具,加樂實業以 Alibaba.com 維運 70% 外貿營收

深耕建築五金市場的加樂實業,也高度肯定 Alibaba.com 在其拓展全球市場過程中的重要角色。加樂實業總經理王拓白表示,公司早在 19 年前便開始使用 Alibaba.com,隨著 Alibaba.com 台灣在地團隊成立,不僅協助加樂實業更有效掌握平台功能,也透過多元課程與培訓活動協助提升跨境電商經營能力,讓公司能以更有效率的方式推動外貿業務,同時將管理工作負擔降低約 50%,員工流動率也減少約 20%。

王拓白指出,加樂實業長期以外貿市場為主要營收來源。過去公司主要透過參加國際展會拓展客戶,一場展覽平均可取得近 70-100 個潛在客戶名單;但在加入 Alibaba.com 後,每月至少能收到超過 350 筆客戶詢問,不僅大幅提升商機來源,也成功培養出年貢獻「億元級」營收的客戶,並將業務版圖拓展至《財富》500 大企業與全球安防領先品牌。

舉例來說,2016 年,加樂實業透過 Alibaba.com 接觸到一名來自澳洲的客戶,最初訂單僅 50 件產品,但在長期合作與信任累積下,訂單量逐年增加,如今已成為公司最大客戶之一,單一客戶一年貢獻營收突破億元。

隨著跨境電商經營的逐漸成熟,加樂實業的外貿結構也出現顯著轉變:過去外貿營收幾乎 100% 來自展會客戶,如今已有高達 70% 的外貿營收來自 Alibaba.com,顯示平台已成為加樂實業拓展全球市場的重要管道。

雙方長期建立的合作默契與信任,也讓加樂實業得以率先導入 Alibaba.com 的 AI 工具並取得實際成效。王拓白以 OKKI CRM 為例說明:「曾有一位合作長達 15 年的客戶訂單突然下滑,我們透過客戶數據分析發現對方開始向其他供應商採購,進一步拜訪後才了解,客戶因為更換經營團隊,產品策略從高階市場轉向平價市場,我們隨即調整產品規格與報價策略,逐步把訂單爭取回來。」

#2 AI 改寫外貿規則!Alibaba.com 用 AI 助台灣中小企業提升跨境獲客力
加樂實業總經理 王拓白
圖/ 數位時代

此外,加樂實業也透過 OKKI AiReach 進行自動化商機開發:只需輸入相關條件,系統便能自動搜尋並篩選潛在客戶名單,在一個月內,挖掘出 748 名潛在客戶並自動發送產品資訊,成功與俄羅斯、美國、杜拜與澳洲等市場的 5 家企業展開合作洽談。

「AiReach 挖掘出的客戶輪廓相當精準,是我們鎖定的進口商與品牌商,因此能大幅提升陌生開發的效率與成交率。」王拓白表示,Alibaba.com 與 AI 工具不僅讓團隊成員可以高效完成跨境電商營運、深入了解市場與客戶動態,更重要的是,可以化被動為主動的布局全球市場,未來將持續深化應用雙方合作與平台工具應用。

偉盛豐貿易跟加樂實業不是特殊案例,Alibaba.com 除持續優化產品服務,更積極協助台灣中小企業跨越全球外貿市場布局門檻,讓其可以更便利且精準的方式提升外貿接單力,創造生態夥伴的共贏。

Alibaba.com

Website: https://seller.alibaba.com/tw

Facebook: https://www.facebook.com/AlibabaTW

Spotify: https://open.spotify.com/show/7IJmBg9V8hjsjxyFPRxmDI?si=66gqnCx2TqiQ91fSWoUqyQ

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓