維基百科25歲了!累計6,500萬條目、每月15億瀏覽,現在AI巨頭紛紛為「合法乾淨」資料上門
維基百科25歲了!累計6,500萬條目、每月15億瀏覽,現在AI巨頭紛紛為「合法乾淨」資料上門

維基百科近期迎來 25 週年。在經歷了四分之一世紀後,它如何從上線時只有100頁的小辭典,發展為人類史上最大的公開知識資料庫?

維基百科中所收錄的海量內容,是現在各家 AI 巨頭訓練 AI 所不可或缺的資料庫。也因此官方近期宣佈與微軟、亞馬遜、Meta、Mistral AI 和 Perplexity 達成企業合作。

這些企業可透過 Wikimedia Enterprise 將維基百科的大量知識整合至自家平台上。維基媒體基金會表示,過往的合作夥伴還包括 Google、Ecosia、Nomic、Pleias、ProRata 和 Reef Media 等公司。

為了慶祝 25 週年,維基百科特別製作了專屬網頁,介紹他們如何走過這趟旅程。官方也為志願編輯們拍攝了短片,向外界強調即使邁入 AI 時代,知識的累積仍然仰賴人類的付出。

官方也揭露了部分關鍵數據,讓外界得以了解維基百科的現況:

• 每月的瀏覽次數接近 150 億次。
• 收錄超過 6,500 萬篇條目,涵蓋 300 多種語言。
• 全球每月約有 25 萬名編輯者參與編輯。
• 每月由超過 15 億個不重複裝置存取。
• 平均每分鐘被編輯 324 次。
• 在全球造訪量排名前十的網站中,唯一由非營利組織營運的網站。

25年前創立

維基百科的誕生,並非一開始就打算顛覆知識世界。它的前身是 2000 年推出的 Nupedia,這是一個試圖以傳統學術方式打造的線上百科全書計畫,由企業家吉米・威爾斯(Jimmy Wales)與哲學家賴瑞・桑格(Larry Sanger)所主導。

Wikipedia 聯合創辦人Jimmy Wales 在接受Standard 採訪時談及AI參與撰寫
威爾斯一開始將維基百科當作一場實驗,測試讓眾人共同參與、而非少數精英,能否建構出線上百科全書。
圖/ Standard

但最初這個概念難以實行,Nupedia 的每一篇文章都需通過多重同行評議,運作一年後完成的條目仍屈指可數。直到 2001 年,威爾斯引入由程式設計師沃德·坎寧安(Ward Cunningham)發明的 Wiki 系統:任何人都可以即時編輯頁面,不需要專業背景,也沒有複雜流程。

2001 年 1 月 15 日,維基百科作為一項實驗正式上線。威爾斯在空無一物的網站上輸入了「Hello World」,這便是維基百科上的第一筆編輯內容。值得一提的是,這一筆編輯在 2021 年以 NFT 的形式出售,賣得了 75 萬美元。

維基百科選擇了一條與以往作法截然不同的道路,不倚賴單一權威,而是相信群體能逐步逼近事實。維基百科在 20 週年網頁上也表示,直到現在這套作法在理論上仍被認為難以實行,然而這卻成為了它們成功的必要支柱。

25萬人共同編輯

在揭露與微軟、亞馬遜等公司締結合作時,維基百科便強調:「在 AI 時代,維基百科內由人類建立及維護的知識,比以往任何時候都更加珍貴。」這些經過編輯討論、協力編纂而成的條目,是 AI 訓練時極為優質的素材。

維基百科的編輯社群,可說是 Web 2.0 時代精神的體現:一個去中心化、由用戶主導,並以參與及協作為基石的知識網絡。來自不同背景、觀點及政治傾向的志願編輯,在完全透明的過程中辯論、交換看法,共同編纂條目,所有的更改與編輯紀錄也都公開透明。

wiki editor.jpg
維基百科強調,廣大的志願編輯是他們能夠成功的根本原因。
圖/ Wikimedia

甚至維基官方也沒有特權。去年年中,維基百科曾一度想順應潮流,實驗性導入 AI 摘要功能,然而這個決策最終在編輯們的反對下撤回。儘管維基官方表示,他們仍然希望能用 AI 技術助力網站發展,但也保證會在編輯的參與下進行。

在慶祝 25 週年的網頁中,維基百科聲稱,之所以能成為網路上最值得信賴的網站之一,是因為這是一個任何人都能使用、編輯及分發的免費內容平台。而這些經由人力編寫、更新的知識,更是 AI 訓練的寶庫。

延伸閱讀:只要把提示詞「說兩次」,LLM效能就升級?Google研究曝「47勝0敗」高CP值解方

6,500萬結構化條目

對大型語言模型而言,維基百科代表著橫跨幾乎所有人類知識領域的「通用語料」,是長期累積且並非為了 SEO 或點擊率而生的純淨內容。在 AI 爬蟲四處覓食、高品質公開文本快速枯竭的當下,哪些資料屬於「合法且值得使用」,已成為發展核心。

從 AI 訓練的角度來看,維基百科條目具備清晰的段落結構,且條目間存在大量連結,這使其非常適合用於訓練 AI 的檢索與摘要能力,更是檢索增強生成(RAG)的最佳素材。

當前各家媒體開始封鎖 AI 爬蟲、網路論壇逐漸商業化,且 AI 生成內容充斥網路,維基百科始終秉持初衷,由人力編寫出有條不紊的知識網頁。其必須附帶來源、保證中立觀點的核心原則,能引導 AI 偏向陳述事實而非表達立場,並學習如何呈現可靠資訊。

簡言之,儘管維基百科是為人類查閱而生,它卻是 AI 訓練資料的「理想型態」。

儘管現在 AI 能快速生成文章、答案與圖像,但維基百科強調,許多人並未意識到,這些生成的內容背後,其實都是由人類記錄、激盪並整理出的知識精華。在 AI 時代,以人為基礎的維基百科反而扮演了更為關鍵的角色。

延伸閱讀:Google公布Gemini收費新制!拆分「思考型」與「Pro」額度,一表看懂方案差異

ChatGPT Translate實測|免費支援逾50種語言,比Google翻譯更好用嗎?誰是繁中王者?

資料來源:Wikimedia(1)Wikimedia(2)Wikimedia(3)

關鍵字: #維基百科 #AI
往下滑看下一篇文章
看見「電話」的數位轉型契機:有河科技3大優勢,打造AHOY雲端總機服務
看見「電話」的數位轉型契機:有河科技3大優勢,打造AHOY雲端總機服務

數位轉型人人都在談,但你有想過,辦公室裡那支「電話」,升級了嗎?

隨著數位轉型成為企業生存的基本功,中小企業紛紛導入各式雲端服務,包括 ERP、CRM 到協作平台等,卻常常忽略最基本、卻最高頻的工具——通訊系統。事實上,當行動、遠距與多據點辦公成為常態,傳統總機不僅建置與維護成本高、佈線不易,更無法滿足企業靈活運作的需求,成為數位轉型中最容易「卡關」的一環。

也因此,雲端總機迅速崛起,成為企業溝通的新基礎設施。它不只是把「打電話」這件事搬上雲,更讓企業擁有隨時、隨地、跨裝置的溝通能力,真正落實以效率為核心的數位轉型。

很早便洞察此一趨勢的有河科技,以自行研發的 AHOY 雲端總機服務切入市場,短短幾年內便累積近 3,000 家企業用戶,其中高達六到七成來自客戶主動推薦——顯示其服務品質與系統穩定性深受用戶肯定。2025 年上半年,營收更較去年同期成長 16%,在競爭激烈的 B2B SaaS 市場中穩步擴張,展現出強勁的產品實力與市場潛力。

從底層架構開始,打造真正為中小企業而生的雲端總機

提及當初切入雲端總機市場的原因,其實是有河科技創業團隊從實務觀察出發,轉化為產品創新的成果。

「父親本來就在電信領域,而我們一家都有宅男基因,兄弟三人從小就對寫程式很有興趣。」有河科技創辦人 Hank 開玩笑的說,也因此創業初期便以異業合作開發模式,雖能發揮電信系統專長、案件金額相對高,卻也受限於合作方技術本身的瓶頸,或是發展方向的不一致。

為此,有河科技開始思考下一步發展,「我們想跳脫客製化電信系統開發的框架,打造能直接面對市場與客戶的產品。」Hank 坦言,這樣的想法促使他們決定結合父親多年來在電信領域累積的經驗,切入雲端總機領域,發展可長期經營的 SaaS 服務。

有河科技02.JPG
有河科技 Hank
圖/ 有河科技

有河科技另一位共同創辦人 Henry 進一步說明,當時市場上雖已有部分業者推出雲端總機服務,但多半是傳統電話總機的延伸應用。這些業者將國外第三方開源軟體整合至自家的電話交換機產品中,讓客戶可以透過手機接聽公司電話。

「但這些廠商本身擅長的是硬體,不具備軟體開發能力,無法提供完整、穩定的雲端解決方案。」Henry 說,更關鍵的是,企業仍需購買硬體交換機與佈線,才能使用行動分機、內外線錄音等雲端總機功能。「這對新創公司或小微型企業其實很不友善。」Henry 坦言,許多中小企業其實只是希望客戶來電時,可以有一段簡單的語音歡迎詞,建立專業形象,但傳統總機高昂的設備與維運成本,卻讓這些簡易需求難以實現。

有河科技03.JPG
有河科技 Henry
圖/ 有河科技

正因如此,有河科技決定從底層架構開始出發,打造一套高品質、易上手且低成本的雲端總機服務,企業不必添購任何硬體設備,也無需佈線,透過 app 或瀏覽器就能即時接聽與撥打公司電話,實現真正的雲端通訊轉型。

為了實現此一理念,有河科技從底層架構到前端應用,皆選擇自行研發,並在過程中建立起三大關鍵優勢,成為其在市場中脫穎而出的基礎。

優勢1》從硬體到軟體的一條龍架構,確保通訊品質

「建構一套語音系統並不難,難的是讓它穩定、清晰、不中斷,」有河科技共同創辦人 Ian 舉例指出,通話中偶爾出現的海浪聲、波浪聲等,不是單靠軟體就能解決,必須有足夠的電信產業 Know-how 和技術,才知道如何排除問題。

有河科技植基於一代在電信領域的技術、經驗與人脈,結合新一代的軟體開發工程概念,不僅奠定自身在雲端通訊系統的穩固基礎,更能打造從伺服器、後台到前端 app 的一條龍架構,確保每一個環節都能做到最佳化整合。

這種從基礎建設到應用層的全面掌控,不只是技術整合能力的展現,更讓有河科技在眾多雲端總機服務中,建立起一道高品質、高彈性的競爭壁壘。

優勢2》從零打造前端 app,用戶需求即產品動力

在前端 app 上,有河科技選擇從底層開始重新構建 app,而非像多數同業僅使用既有開源軟體或代理第三方軟體,確保未來在功能擴充與版本更新上的自主性與彈性。

「我們很多功能其實都是客戶給的建議,」 Ian 分享,只要客戶提出功能需求,內部就會評估是否具有普遍性,若評估後發現可以滿足八成以上客戶的使用需求,就會主動投入開發並進行系統更新,提供給所有客戶使用。

這種用戶驅動的產品設計思維,不僅讓功能更貼近實務需求,也讓有河科技可以將開發資源集中在最具價值的地方,持續強化系統的共用性與延展性,打造出真正能隨企業成長而調整的雲端通訊平台。

優勢3》彈性 API 整合,支援多元通訊情境

有河科技的軟體研發能力,不只能夠與時俱進的更新產品,還能根據企業需求彈性整合 CRM 等各種系統或客製化開發特殊服務,打造多元化通訊場景。

舉例來說,外送或代駕媒合平台希望提供號碼遮罩(Number Masking)機制,保障司機與用戶的個資安全,有河科技便為此進行開發,當司機在與客戶聯繫時,客戶手機上只會顯示公司的代表號,之後若客戶回撥,AHOY 也能將來電導至接單司機,達到保護隱私又不中斷溝通的雙重目標。

又或是與 LINE API 整合,可以將既有官方帳號商家的通話,直接升級成專業雲端總機系統等級、甚至可以一併介接各家不同特色的 AI 文字客服以及 AI 語音客服,即時產生逐字稿並進行服務品質情緒分析。

在許多企業還將總機視為「基礎設施」時,有河科技早就運用 AHOY 雲端總機服務,重新定義企業與客戶、內部團隊之間的溝通方式。

隨著企業通訊越來越重視彈性與效率,有河科技運用 SaaS 模式與與技術實力,悄悄搶下這波通訊革新的先機。未來,有河科技將聚焦在 WebCall 網頁電話整合介接與 AI 客服兩大應用場景,不僅讓用戶能在 LINE 官方帳號或網站上直接使用 AHOY 通話,也希望藉由異業合作導入更多元 AI 應用,提升服務效率與回應品質,打造更聰明、更好用的智慧通訊平台。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓