維基百科25歲了!累計6,500萬條目、每月15億瀏覽,現在AI巨頭紛紛為「合法乾淨」資料上門
維基百科25歲了!累計6,500萬條目、每月15億瀏覽,現在AI巨頭紛紛為「合法乾淨」資料上門

維基百科近期迎來 25 週年。在經歷了四分之一世紀後,它如何從上線時只有100頁的小辭典,發展為人類史上最大的公開知識資料庫?

維基百科中所收錄的海量內容,是現在各家 AI 巨頭訓練 AI 所不可或缺的資料庫。也因此官方近期宣佈與微軟、亞馬遜、Meta、Mistral AI 和 Perplexity 達成企業合作。

這些企業可透過 Wikimedia Enterprise 將維基百科的大量知識整合至自家平台上。維基媒體基金會表示,過往的合作夥伴還包括 Google、Ecosia、Nomic、Pleias、ProRata 和 Reef Media 等公司。

為了慶祝 25 週年,維基百科特別製作了專屬網頁,介紹他們如何走過這趟旅程。官方也為志願編輯們拍攝了短片,向外界強調即使邁入 AI 時代,知識的累積仍然仰賴人類的付出。

官方也揭露了部分關鍵數據,讓外界得以了解維基百科的現況:

• 每月的瀏覽次數接近 150 億次。
• 收錄超過 6,500 萬篇條目,涵蓋 300 多種語言。
• 全球每月約有 25 萬名編輯者參與編輯。
• 每月由超過 15 億個不重複裝置存取。
• 平均每分鐘被編輯 324 次。
• 在全球造訪量排名前十的網站中,唯一由非營利組織營運的網站。

25年前創立

維基百科的誕生,並非一開始就打算顛覆知識世界。它的前身是 2000 年推出的 Nupedia,這是一個試圖以傳統學術方式打造的線上百科全書計畫,由企業家吉米・威爾斯(Jimmy Wales)與哲學家賴瑞・桑格(Larry Sanger)所主導。

Wikipedia 聯合創辦人Jimmy Wales 在接受Standard 採訪時談及AI參與撰寫
威爾斯一開始將維基百科當作一場實驗,測試讓眾人共同參與、而非少數精英,能否建構出線上百科全書。
圖/ Standard

但最初這個概念難以實行,Nupedia 的每一篇文章都需通過多重同行評議,運作一年後完成的條目仍屈指可數。直到 2001 年,威爾斯引入由程式設計師沃德·坎寧安(Ward Cunningham)發明的 Wiki 系統:任何人都可以即時編輯頁面,不需要專業背景,也沒有複雜流程。

2001 年 1 月 15 日,維基百科作為一項實驗正式上線。威爾斯在空無一物的網站上輸入了「Hello World」,這便是維基百科上的第一筆編輯內容。值得一提的是,這一筆編輯在 2021 年以 NFT 的形式出售,賣得了 75 萬美元。

維基百科選擇了一條與以往作法截然不同的道路,不倚賴單一權威,而是相信群體能逐步逼近事實。維基百科在 20 週年網頁上也表示,直到現在這套作法在理論上仍被認為難以實行,然而這卻成為了它們成功的必要支柱。

25萬人共同編輯

在揭露與微軟、亞馬遜等公司締結合作時,維基百科便強調:「在 AI 時代,維基百科內由人類建立及維護的知識,比以往任何時候都更加珍貴。」這些經過編輯討論、協力編纂而成的條目,是 AI 訓練時極為優質的素材。

維基百科的編輯社群,可說是 Web 2.0 時代精神的體現:一個去中心化、由用戶主導,並以參與及協作為基石的知識網絡。來自不同背景、觀點及政治傾向的志願編輯,在完全透明的過程中辯論、交換看法,共同編纂條目,所有的更改與編輯紀錄也都公開透明。

wiki editor.jpg
維基百科強調,廣大的志願編輯是他們能夠成功的根本原因。
圖/ Wikimedia

甚至維基官方也沒有特權。去年年中,維基百科曾一度想順應潮流,實驗性導入 AI 摘要功能,然而這個決策最終在編輯們的反對下撤回。儘管維基官方表示,他們仍然希望能用 AI 技術助力網站發展,但也保證會在編輯的參與下進行。

在慶祝 25 週年的網頁中,維基百科聲稱,之所以能成為網路上最值得信賴的網站之一,是因為這是一個任何人都能使用、編輯及分發的免費內容平台。而這些經由人力編寫、更新的知識,更是 AI 訓練的寶庫。

延伸閱讀:只要把提示詞「說兩次」,LLM效能就升級?Google研究曝「47勝0敗」高CP值解方

6,500萬結構化條目

對大型語言模型而言,維基百科代表著橫跨幾乎所有人類知識領域的「通用語料」,是長期累積且並非為了 SEO 或點擊率而生的純淨內容。在 AI 爬蟲四處覓食、高品質公開文本快速枯竭的當下,哪些資料屬於「合法且值得使用」,已成為發展核心。

從 AI 訓練的角度來看,維基百科條目具備清晰的段落結構,且條目間存在大量連結,這使其非常適合用於訓練 AI 的檢索與摘要能力,更是檢索增強生成(RAG)的最佳素材。

當前各家媒體開始封鎖 AI 爬蟲、網路論壇逐漸商業化,且 AI 生成內容充斥網路,維基百科始終秉持初衷,由人力編寫出有條不紊的知識網頁。其必須附帶來源、保證中立觀點的核心原則,能引導 AI 偏向陳述事實而非表達立場,並學習如何呈現可靠資訊。

簡言之,儘管維基百科是為人類查閱而生,它卻是 AI 訓練資料的「理想型態」。

儘管現在 AI 能快速生成文章、答案與圖像,但維基百科強調,許多人並未意識到,這些生成的內容背後,其實都是由人類記錄、激盪並整理出的知識精華。在 AI 時代,以人為基礎的維基百科反而扮演了更為關鍵的角色。

延伸閱讀:Google公布Gemini收費新制!拆分「思考型」與「Pro」額度,一表看懂方案差異

ChatGPT Translate實測|免費支援逾50種語言,比Google翻譯更好用嗎?誰是繁中王者?

資料來源:Wikimedia(1)Wikimedia(2)Wikimedia(3)

關鍵字: #維基百科 #AI
往下滑看下一篇文章
凱基金控以數位化陪伴組織成長
凱基金控以數位化陪伴組織成長

隨著凱基金控集團業務的拓展及人力規模的增加,人力資源管理日益複雜。如何在資源有限的情況下,透過數位化的人力資源系統,有效整合多元資料來源,簡化流程、提升作業準確性,並加強資訊透明度與合規性,成為提升營運韌性的重要挑戰。

十年前的選擇,開啟人資系統化的第一步

十年前,凱基金控(當時為中華開發金控)正值快速成長與轉型。面對愈來愈多元的人力結構與日益複雜的行政作業,人資團隊意識到,要支撐長期發展,必須建立一套現代化的作業基礎。因此啟動了與叡揚資訊的合作,採用 Radar 人力資源管理系統,建構系統化的人資架構,支持組織的管理需求。

複雜的薪資作業,仰賴穩健成熟的系統

近十年來,凱基金控持續推動數位化轉型,提升組織效能與員工體驗。人資長暨資深副總經理陳慧珠表示: 「在人資作業中,薪資處理向來是最具複雜性且最需精確執行的流程。不同職務對應不同薪酬制度,獎金與津貼設計亦各具差異,加上法令不斷更新,以及金融業對法遵的高度要求,使薪資作業成為人資行政工作的重點要務。」

叡揚資訊陪伴凱基一路至今,協助穩定發放薪資逾十年,展現其長期專業投入。多年來,薪資、獎金計算及法規調整等繁複的人工作業,皆已透過系統化流程迅速完成。能夠支撐多年穩定運作的,除了成熟穩定的系統,更仰賴叡揚在資訊安全、系統維運及制度更新上持續與時俱進的能力。

法規與資安兼顧,提升人資作業信賴度

金融產業監管環境日益複雜,人資法規調整已成常態。基本薪資、勞健保級距及加班費或獎金計算等變動,皆是HR每年必須應對的挑戰。Radar人力資源管理系統具備即時更新與調整能力,有效協助凱基持續保持合規。多年來,系統穩定性及法規更新速度皆值得信賴,讓組織能安心因應各項變動。

資安同樣重要。隨著網路攻擊手法演變,叡揚團隊總能即時調整與支援,確保系統穩定。這種持續的安全守護與技術支援,讓凱基在日常營運中更加安心,能專注於人資流程的優化,而無需擔憂系統安全性。

優質合作夥伴,組織成長的重要角色

回顧數位化轉型歷程,凱基金控深刻體會到,優質的合作夥伴在推動組織成長過程中扮演重要的角色。叡揚資訊以穩定的系統、專業服務及即時支援,協助凱基金控順利應對各項挑戰,確保人資與薪資作業的合規與高效。長期合作累積的信任,為未來攜手共進奠定良好基礎。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓