Perplexity是資料小偷?Cloudflare揭偽裝Chrome爬蟲,遭反嗆「我看你是不懂AI助理」
Perplexity是資料小偷?Cloudflare揭偽裝Chrome爬蟲,遭反嗆「我看你是不懂AI助理」

(2025.08.05 1700 更新Perplexity聲明)

重點一:雲端防護服務商Cloudflare指出AI搜尋引擎Perplexity以隱形爬蟲繞過robots.txt與WAF規則,仍能擷取受限網頁內容。

重點二:該爬蟲偽裝成Chrome瀏覽器並頻繁更換 IP、ASN,每日仍對全球網站送出約2,000至 2,500萬請求。

重點三:Perplexity強調其「user-driven agent」只在用戶發出請求時才抓取內容,且僅用於當下回答,不會長期保存或訓練模型。

Cloudflare (雲端防護服務商) 4 日發表最新觀測揭露 Perplexity 在遭封鎖後,改以偽裝瀏覽器的未宣告爬蟲繞過 robots.txt 與 WAF 限制,仍成功抓取原本禁止擷取的內容。此舉不僅違背 RFC 9309 所訂網路共識,也衝擊網站對合法爬蟲的基本信任機制。

換句話說,Perplexity 在被網站擋下後,沒有守規矩地停止,而是讓一支假扮成一般 Chrome 瀏覽器 的爬蟲再偷偷抓取資料。

Cloudflare指出,包括PerplexityBot和Perplexity-User兩種爬蟲,會忽視網站寫在 robots.txt 裏面「禁止抓資料」的指令,連 WAF(Web 應用程式防火牆)的封鎖也設法繞開。

結果就是: 網站原本不想被抓走的內容,仍被抓走;而這種故意違反網路約定(見 RFC 9309)的行為,會削弱網站對「守規矩的爬蟲都會自我標示、遵守限制」這套信任機制。

對於上述指控,Perplexity 發言人 Jesse Dwyer 反駁稱相關貼文只是 Cloudflare 的「銷售話術」,並否認爬蟲為自家所有。不過,Perplexity 去年確實因《Wired》等媒體指其未經授權引用全文而陷入「抄襲」爭議,執行長 Aravind Srinivas 也被質疑對「抄襲」定義語焉不詳。

Cloudflare 近月祭出「AI爬蟲按次付費」功能,讓出版社與網站能為資料存取設定明確定價;同時在旗下免費「Bot Fight Mode」新增 AI-bot 專用封鎖規則,網站只需一鍵即可拒絕或限速未付費的爬蟲,藉此把「給錢才給料」的談判主導權拉回內容擁有者。

Cloudflare如何抓包Perplexity?

Cloudflare 先接獲多家客戶反映,指出即便已在「禁止機器抓取」的 robots.txt 檔案與防火牆(WAF)中封鎖 Perplexity 的官方爬蟲,網站內容仍遭擷取。公司先行確認客戶設定無誤後,進一步購買數個全新且對外完全隱藏的測試網域,並在其中同樣下達「全面禁止爬蟲」指令。

接著,Cloudflare 直接向 Perplexity 詢問這些測試網域的內容,結果卻收到詳盡回答,證實有未經宣告的爬蟲進入。最後,Cloudflare 透過流量分析比對,發現這批爬蟲假冒一般瀏覽器身分,每日仍對全球網站發送約兩千萬次請求,且頻繁更換 IP 與網路識別碼。

綜合上述三項證據,Cloudflare 認定 Perplexity違反公開爬蟲規範,隨即取消其「已驗證機器人」資格並將相關流量列入封鎖清單。

Cloudflare抓包Perplexity.jpeg
這張圖解釋了 Perplexity 的「官方→偽裝→重試」路徑與每一步判斷條件,凸顯其繞過網站保護機制的行為模式。
圖/ Cloudflare

Perplexity 遭剔除「已驗證機器人」名單

Cloudflare 隨即將 Perplexity 剔除「已驗證機器人」名單,並於所有方案推送新簽章,協助站點自動阻擋或挑戰此類隱形爬蟲。公司同時呼籲業者遵守「透明、節制、單一目的」等五大善意爬蟲原則,並與 IETF 共同推動擴充版 robots.txt。

官方亦肯定 OpenAI (開放人工智慧) 旗下 ChatGPT-User 嚴格尊重封鎖指令,並採用 Web Bot Auth 身分簽章,作為業界良好示範。

Perplexity反嗆:我看你是完全不懂AI助理

針對Cloudflare指控,Perplexity在X聲明反擊,直言傳統網路爬蟲(bot)與現代AI助理(agent)的本質不同。傳統爬蟲會自動、大規模地抓取網頁內容並建立資料庫,而AI助理(如Perplexity)則是根據用戶即時需求,臨時抓取並回應,不會儲存或用於訓練。

Perplexity強調其「user-driven agent」只在用戶發出請求時才抓取內容,且僅用於當下回答,不會長期保存或訓練模型。

Perplexity批評Cloudflare將AI助理誤認為惡意bot,認為這種做法會傷害用戶權益,阻礙資訊自由流通,甚至可能影響如醫療、新聞等重要資訊的取得。

聲明指出,Cloudflare在技術分析上有重大錯誤,將第三方流量誤歸因於Perplexity,並發布不正確的技術圖示,顯示其對現代AI助理運作方式缺乏理解。

Perplexity認為,若基礎設施供應商無法區分合法AI助理與惡意爬蟲,將危及開放網路的創新與用戶選擇權。

合規爬蟲的5大原則

依據 Cloudflare 的說明,守規矩的爬蟲至少符合下列五項原則:

  • 透明 (Transparency)
    主動標示專屬的 User-Agent,公開 IP 範圍或使用 Web Bot Auth 驗證,並附上聯絡資訊,便於站方追蹤與溝通。
  • 克制 (Good Netizenship)
    不大量灌流量、不抓取敏感資料,也不使用隱藏或偽裝手段規避偵測。
  • 明確目的 (Clear Purpose)
    每一隻爬蟲都應說清楚用於哪項服務,例如語音助理、比價、無障礙輔助等,讓站方能判斷是否開放。
  • 分工清楚 (Separate Bots for Separate Activities)
    不同功能用不同爬蟲執行,避免讓站方陷入「全開或全關」的兩難。
  • 遵守規則 (Follow the Rules)
    必須檢查並尊重 robots.txt、維持合理速率,且不得繞過 WAF 或其他安全防護。

這五條囊括了對網站「可辨識、可控管、可信任」的核心要求,亦是 Cloudflare 評定爬蟲是否值得授予「已驗證機器人」資格的依據。

延伸閱讀:Lawsnote為什麼「判4年、賠1億」那麼重?律師解讀一審判決:爬蟲到底行不行?
影片|6萬次爬蟲只換來1次點擊!AI搜尋促成「流量大斷崖」:Google如何改寫搜尋行規?

資料來源:CloudflareTechChurch

本文初稿為AI編撰,整理.編輯/ 李先泰

往下滑看下一篇文章
從室內到開放水域安全,富據智能藉 NVIDIA AI 技術及新創計畫助力,快速搶進全球智慧安防市場
從室內到開放水域安全,富據智能藉 NVIDIA AI 技術及新創計畫助力,快速搶進全球智慧安防市場

富據智能科技(Fortune AI Technologies)成立於2021年9月,歷經2年餘的市場試煉,將目標市場聚焦在水域安防,並從飯店泳池與運動中心等室內水域出發,推出以 AI 影像辨識與動作預測演算法等技術為核心的「安心泳(SAFE SWIM)」服務,在異常事件發生時立即示警,如泳客突然在水中抽筋等,解決傳統人工監控的盲點,以智慧且高效的方式落實水域安全、避免憾事發生。

專業的產品服務與清楚的市場定位讓富據智能在台灣快速站穩腳步,並且將業務範疇推向日本、香港、西班牙等海外市場,創下產品服務推出不到兩年即在全球25個案場上線的佳績,接下來,將透過 NVIDIA Omniverse™ 平台與 NVIDIA Cosmos™ 模型進行生成 AI 影像,以加速海外室內水域案場的上線速度,以及逐步將服務擴展到開放水域,打造全方位智慧水域安防服務。

NVIDIAxFortune AI(富據智能)
圖/ 數位時代

富據智能創辦人暨執行長陳靖儒解釋:「團隊成員本來就擅長 AI 影像辨識與物件追蹤技術,在朋友介紹下,涉足飯店泳池與運動中心等室內水域安全,隨著數據資料的累積、演算法與模型的完善,以及案場經驗的累積,我們除計畫將 SAFE SWIM 應用範疇從室內水域擴及開放水域,也計畫在明年上半於日本成立株式會社,以軟硬整合的產品服務,攜手代理商擴展亞洲乃至全球市場。」

不僅聚焦 AI 軟體平台,更以 NVIDIA 技術資源推動全方位智慧安防解決方案

富據智能為什麼能在短時間繳交亮眼成績單?關鍵因素有三:

第一,領先同業推出 AI 智慧水域安防– SAFE SWIM –服務,快速導入案場與累積關鍵數據集,如水面波光折射、泳池中人員動作特徵等資料,藉此優化 SAFE SWIM 的辨識精準度,拉高市場進入門檻。

陳靖儒表示:「我們不僅是台灣第一個專注水域安全的新創團隊,也擁有最多的水域數據,可以持續優化模型精準度,加速海外市場擴展腳步。」舉例來說,日本政府沒有強制規範泳池等特定水域需要配置救生員,但是,為確保泳池安全、提供安心與差異化服務,飯店業者願意嘗試智慧水域安防等創新服務,看好該塊市場,富據智能攜手代理商夥伴耕耘日本市場,加快 SAFE SWIM 的普及度。

第二,透過 NVIDIA Inception 新創計畫加速產品開發與服務上線速度。陳靖儒表示,透過 NVIDIA Inception 新創計畫,富據智能不僅可以優惠價格購買特定硬體與軟體產品,免費取得 GPU 雲端資源與優先存取 NVIDIA 軟體開發套件(SDK)等資格,還可以跟 NVIDIA 專家展開密切討論,大幅提升軟硬體整合開發時程,同時,確保產品服務的精準度與品質。

例如,在開發海外案場時,團隊成員透過 NVIDIA® Jetson Orin Nano™ Super 運算平台及 NVIDIA Metropolis 開發套件加速應用的開發確保 SAFE SWIM 可以即時分析案場搭載的攝影機數據資料,確保辨識準確度,以及服務的穩定性、安全性與可擴充性。

值得特別一提的是,透過 NVIDIA Inception 新創計畫裡的 NVIDIA 深度學習學院(DLI)訓練課程,富據智能開始以生成式 AI 技術合成影像數據、加速模型調整速度。富據智能技術長林聖傑解釋:「因應案場環境的不同,我們必須微調模型才能夠上線 SAFE SWIM 服務。過去的作法是先在案場架設8到12個攝影機,聘僱人員在泳池與池畔演示各種(情境)姿勢,藉此蒐集訓練用影像數據以微調模型,整個時程至少需要2至4週不等的時間,現在,透過 NVIDIA Omniverse™ 平台與 NVIDIA Cosmos™ 世界基礎模型 (WFM) ,系統會直接以合成訓練影像數據,減少70%以上的作業時間,大幅提升服務上線速度。」

NVIDIAxFortune AI(富據智能)
圖/ 數位時代

NVIDIA Inception 新創計畫除了在技術與產品上提供支持,也是新創曝光的重要舞台。以富據智能為例,透過在2025 COMPUTEX InnoVEX 與 NVIDIA 共同行銷等方式,不僅提升品牌能見度,更吸引眾多國際業者上門洽談,推動全球市場布局。

最後是建立 AI 智慧水域安防全球夥伴生態圈。各國政府對於室內與開放水域的安全規範不一,以及關注的水域安防議題不盡相同,不可能單憑己力開發市場,富據智能除透過 NVIDIA Inception 新創計畫取得來自 NVIDIA 的技術支持,加速產品與商務開發,還會與攝影機、無人機、系統整合商與服務代理商合作,精準滿足各個市場(客戶)的水域安全需求。

「在 AI 新世代,光是掌握技術還不夠,必須深入產業、因應情境提供適切解方,因此,我們樂於擴展全球生態網絡,鎖定公、私部門需求提供智慧水域安防服務。」 陳靖儒如是說道。

NVIDIAxFortune AI(富據智能)
圖/ 數位時代

NVIDIA Inception 新創計畫成為 StarFab AI 加速器的重量級合作夥伴之一,擴大新創支援能量

為讓新創可以更快將加速運算與人工智慧等尖端技術轉化成智慧應用,NVIDIA 於2016年即展開 NVIDIA Inception 新創計畫,只要登記時間未滿10年、具備核心技術與專業團隊,聚焦在 DeepTech 的新創都歡迎加入。成為 Inception 新創計畫會員後,不僅能享有 GPU 雲端資源、DLI 課程學分、優先存取 NVIDIA 軟體開發套件,以及以優惠價格購買特定軟體與硬體產品等四種資源,還可以跟 NVIDIA 專家、1,200家創業投資夥伴以及參與計畫的32,000家新創夥伴交流,大幅加速技術開發與商業連結,放眼全球市場。

為了進一步擴大新創支援能量,NVIDIA Inception 新創計畫聚焦在協助新創從0到1打造符合市場要求的產品,至於從1到100則將需要更多的創投夥伴與合作企業與資源來協助新創公司。

NVIDIAxFortune AI(富據智能)
圖/ 數位時代

有鑑於此, NVIDIA Inception 新創計畫,為加深在台灣地區的支持力度,成為 StarFab 於2025年5月啟動的「TAI1 AI Accelerator」的合作夥伴之一,獲選新創將取得 NVIDIA Inception 新創計畫專屬資源,以及 ITIC 以 SAFE 機制提供團隊台幣300萬元投資,為新創進軍國際市場打下關鍵基礎。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
蘋果能再次偉大?
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓