Perplexity是資料小偷?Cloudflare揭偽裝Chrome爬蟲,遭反嗆「我看你是不懂AI助理」
Perplexity是資料小偷?Cloudflare揭偽裝Chrome爬蟲,遭反嗆「我看你是不懂AI助理」

(2025.08.05 1700 更新Perplexity聲明)

重點一:雲端防護服務商Cloudflare指出AI搜尋引擎Perplexity以隱形爬蟲繞過robots.txt與WAF規則,仍能擷取受限網頁內容。

重點二:該爬蟲偽裝成Chrome瀏覽器並頻繁更換 IP、ASN,每日仍對全球網站送出約2,000至 2,500萬請求。

重點三:Perplexity強調其「user-driven agent」只在用戶發出請求時才抓取內容,且僅用於當下回答,不會長期保存或訓練模型。

Cloudflare (雲端防護服務商) 4 日發表最新觀測揭露 Perplexity 在遭封鎖後,改以偽裝瀏覽器的未宣告爬蟲繞過 robots.txt 與 WAF 限制,仍成功抓取原本禁止擷取的內容。此舉不僅違背 RFC 9309 所訂網路共識,也衝擊網站對合法爬蟲的基本信任機制。

換句話說,Perplexity 在被網站擋下後,沒有守規矩地停止,而是讓一支假扮成一般 Chrome 瀏覽器 的爬蟲再偷偷抓取資料。

Cloudflare指出,包括PerplexityBot和Perplexity-User兩種爬蟲,會忽視網站寫在 robots.txt 裏面「禁止抓資料」的指令,連 WAF(Web 應用程式防火牆)的封鎖也設法繞開。

結果就是: 網站原本不想被抓走的內容,仍被抓走;而這種故意違反網路約定(見 RFC 9309)的行為,會削弱網站對「守規矩的爬蟲都會自我標示、遵守限制」這套信任機制。

對於上述指控,Perplexity 發言人 Jesse Dwyer 反駁稱相關貼文只是 Cloudflare 的「銷售話術」,並否認爬蟲為自家所有。不過,Perplexity 去年確實因《Wired》等媒體指其未經授權引用全文而陷入「抄襲」爭議,執行長 Aravind Srinivas 也被質疑對「抄襲」定義語焉不詳。

Cloudflare 近月祭出「AI爬蟲按次付費」功能,讓出版社與網站能為資料存取設定明確定價;同時在旗下免費「Bot Fight Mode」新增 AI-bot 專用封鎖規則,網站只需一鍵即可拒絕或限速未付費的爬蟲,藉此把「給錢才給料」的談判主導權拉回內容擁有者。

Cloudflare如何抓包Perplexity?

Cloudflare 先接獲多家客戶反映,指出即便已在「禁止機器抓取」的 robots.txt 檔案與防火牆(WAF)中封鎖 Perplexity 的官方爬蟲,網站內容仍遭擷取。公司先行確認客戶設定無誤後,進一步購買數個全新且對外完全隱藏的測試網域,並在其中同樣下達「全面禁止爬蟲」指令。

接著,Cloudflare 直接向 Perplexity 詢問這些測試網域的內容,結果卻收到詳盡回答,證實有未經宣告的爬蟲進入。最後,Cloudflare 透過流量分析比對,發現這批爬蟲假冒一般瀏覽器身分,每日仍對全球網站發送約兩千萬次請求,且頻繁更換 IP 與網路識別碼。

綜合上述三項證據,Cloudflare 認定 Perplexity違反公開爬蟲規範,隨即取消其「已驗證機器人」資格並將相關流量列入封鎖清單。

Cloudflare抓包Perplexity.jpeg
這張圖解釋了 Perplexity 的「官方→偽裝→重試」路徑與每一步判斷條件,凸顯其繞過網站保護機制的行為模式。
圖/ Cloudflare

Perplexity 遭剔除「已驗證機器人」名單

Cloudflare 隨即將 Perplexity 剔除「已驗證機器人」名單,並於所有方案推送新簽章,協助站點自動阻擋或挑戰此類隱形爬蟲。公司同時呼籲業者遵守「透明、節制、單一目的」等五大善意爬蟲原則,並與 IETF 共同推動擴充版 robots.txt。

官方亦肯定 OpenAI (開放人工智慧) 旗下 ChatGPT-User 嚴格尊重封鎖指令,並採用 Web Bot Auth 身分簽章,作為業界良好示範。

Perplexity反嗆:我看你是完全不懂AI助理

針對Cloudflare指控,Perplexity在X聲明反擊,直言傳統網路爬蟲(bot)與現代AI助理(agent)的本質不同。傳統爬蟲會自動、大規模地抓取網頁內容並建立資料庫,而AI助理(如Perplexity)則是根據用戶即時需求,臨時抓取並回應,不會儲存或用於訓練。

Perplexity強調其「user-driven agent」只在用戶發出請求時才抓取內容,且僅用於當下回答,不會長期保存或訓練模型。

Perplexity批評Cloudflare將AI助理誤認為惡意bot,認為這種做法會傷害用戶權益,阻礙資訊自由流通,甚至可能影響如醫療、新聞等重要資訊的取得。

聲明指出,Cloudflare在技術分析上有重大錯誤,將第三方流量誤歸因於Perplexity,並發布不正確的技術圖示,顯示其對現代AI助理運作方式缺乏理解。

Perplexity認為,若基礎設施供應商無法區分合法AI助理與惡意爬蟲,將危及開放網路的創新與用戶選擇權。

合規爬蟲的5大原則

依據 Cloudflare 的說明,守規矩的爬蟲至少符合下列五項原則:

  • 透明 (Transparency)
    主動標示專屬的 User-Agent,公開 IP 範圍或使用 Web Bot Auth 驗證,並附上聯絡資訊,便於站方追蹤與溝通。
  • 克制 (Good Netizenship)
    不大量灌流量、不抓取敏感資料,也不使用隱藏或偽裝手段規避偵測。
  • 明確目的 (Clear Purpose)
    每一隻爬蟲都應說清楚用於哪項服務,例如語音助理、比價、無障礙輔助等,讓站方能判斷是否開放。
  • 分工清楚 (Separate Bots for Separate Activities)
    不同功能用不同爬蟲執行,避免讓站方陷入「全開或全關」的兩難。
  • 遵守規則 (Follow the Rules)
    必須檢查並尊重 robots.txt、維持合理速率,且不得繞過 WAF 或其他安全防護。

這五條囊括了對網站「可辨識、可控管、可信任」的核心要求,亦是 Cloudflare 評定爬蟲是否值得授予「已驗證機器人」資格的依據。

延伸閱讀:Lawsnote為什麼「判4年、賠1億」那麼重?律師解讀一審判決:爬蟲到底行不行?
影片|6萬次爬蟲只換來1次點擊!AI搜尋促成「流量大斷崖」:Google如何改寫搜尋行規?

資料來源:CloudflareTechChurch

本文初稿為AI編撰,整理.編輯/ 李先泰

往下滑看下一篇文章
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作
影音體驗成行動網路新戰場!Opensignal 揭台灣大哥大奪「雙料冠軍」,連網穩定撐起高負載影音與 AI 協作

現代人手機不離手,通勤時滑短影音、午休追串流影劇、下午開視訊會議,網路影音應用成為工作與生活的普遍情境。然而,一旦畫面卡頓、畫質不穩,或聲畫不同步,使用體驗立刻打折,甚至影響工作效率與專業判斷。

也因此,網路品質不再只是「快不快」的問題,更關乎能否在高使用量的日常情境下,維持穩定、連續的表現;對此,第三方評測也採用更貼近使用者情境的方式衡量網路體感。而 Opensignal 最新報告指出,台灣大哥大在影音體驗相關項目是業界唯一同時拿下「影音體驗」與「5G 影音體驗」雙項獎項的電信商,其中,關鍵的差異是什麼?

為何「影音體驗」是網路品質的關鍵指標?

愈來愈多消費者入手旗艦機,追求的不只是硬體規格,還有流暢的 AI 應用與多工協作。然而,無論是視訊即時翻譯或雲端會議,這些高階功能都有一個共同前提:網路必須穩定。一旦網路品質不佳導致畫質下降或音畫不同步,旗艦級的 AI 功能將形同虛設。

這也意味著,檢驗網路價值的標準已經改變。如今,不能只看單點測速的瞬間峰值,更重要的是高負載情境下的耐力表現。因此,比起單點測速,影音體驗會是更完整的測試標準,直接挑戰了網路在室內深處、移動途中或人潮聚集時的網路實力;而唯有在長時間串流下依然不卡頓、不降畫質,才稱得上是高品質的連線。

換言之,隱身在硬體背後的電信商,才是發揮旗艦機性能的關鍵;唯有透過最佳網路品質,才能讓手中的旗艦機既是規格領先、也是體驗領先。

唯一影音體驗雙料冠軍,Opensignal 權威認證的有感體驗

雖然相較於測速數據,影音體驗更貼近日常使用,但也更難量化。對此,國際權威認證 Opensignal 的「影音體驗分數」,依循 ITU 國際標準,透過真實用戶裝置在行動網路上進行影音串流的實測數據,觀察不同電信網路在實際使用情境下的表現。

簡單來說,評測聚焦三項核心指標:影片載入時間、播放期間的卡頓率,以及畫質(解析度)是否能穩定維持。使用者從開始播放到持續觀看的整體品質,分數以 0–100 呈現,分數愈高,代表在三項指標的表現愈佳。相較於單點測速,這類評測更能呈現長時間、高使用量下的網路品質。

人流情境不降速.jpg
圖/ 數位時代

而在今年最新公布的 Opensignal 評測中,台灣大哥大獲得「影音體驗」獎項唯一雙料冠軍。其中,「整體影音體驗」為全台獨得第一名,「5G 影音體驗」則與遠傳並列第一。

之所以能在影音體驗拔得頭籌,關鍵在於台灣大哥大目前是全台唯一整合 3.5GHz 頻段 60MHz 與 40MHz、形成 100MHz 總頻寬的電信業者,亦是現階段全台最大 5G 黃金頻寬配置。頻寬愈寬,代表單位時間內可傳輸的資料量愈大;在大量使用者同時進行影音串流、視訊互動的狀態下,更能維持穩定傳輸、減少壅塞發生機率。

台灣大獲權威認證,NRCA技術撐起穩定基礎

除了頻寬帶來的流量優勢,台灣大哥大也採用「NRCA 高低頻整合技術」,也就是透過高低頻協作,讓 3.5GHz 負責高速傳輸、700MHz 補強覆蓋與室內連線,改善室內深處與移動情境的訊號落差,提升連線連續性。

同時,為了讓住家、通勤動線、商圈與觀光熱點等高使用場域維持穩定表現,台灣大哥大已在全台超過213個住宅、觀光及商圈熱點完成 100MHz 布建,提升人流密集區的網路覆蓋率。

5G高速(小).jpg
圖/ dreamstime

值得注意的是,在今年的 Opensignal 評比中,台灣大哥大還拿下了「5G 語音體驗」與「網路可用率」兩項第 1 名,累計獲得 4 項獎項。這意味著不僅具備影音體驗優勢,在語音互動與連線率等關乎用戶日常應用的基礎指標,皆有亮眼成績。

尤其,隨著影音與即時互動成為新世代的工作常態,網路品質的重要性只會持續上升。無論是遠距協作所仰賴的視訊與畫面共享即時同步,內容創作對直播與即時上傳連續性的要求,或是 AI 視訊互動、即時翻譯與會議摘要等新應用,都高度依賴低延遲與穩定的資料傳輸。網路品質因此不再只是連線條件,更是支撐內容生產、協作效率與新應用落地的基礎能力,甚至直接牽動競爭力。

而台灣大哥大經 Opensignal 認證、於多項關鍵指標領先業界,不僅將成為 AI 時代的重要後盾,也讓使用者能更充分發揮高階手機的效能,把「快、穩、滑順」落實在每天的工作與生活中。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓