Perplexity是資料小偷?Cloudflare揭偽裝Chrome爬蟲,遭反嗆「我看你是不懂AI助理」
Perplexity是資料小偷?Cloudflare揭偽裝Chrome爬蟲,遭反嗆「我看你是不懂AI助理」

(2025.08.05 1700 更新Perplexity聲明)

重點一:雲端防護服務商Cloudflare指出AI搜尋引擎Perplexity以隱形爬蟲繞過robots.txt與WAF規則,仍能擷取受限網頁內容。

重點二:該爬蟲偽裝成Chrome瀏覽器並頻繁更換 IP、ASN,每日仍對全球網站送出約2,000至 2,500萬請求。

重點三:Perplexity強調其「user-driven agent」只在用戶發出請求時才抓取內容,且僅用於當下回答,不會長期保存或訓練模型。

Cloudflare (雲端防護服務商) 4 日發表最新觀測揭露 Perplexity 在遭封鎖後,改以偽裝瀏覽器的未宣告爬蟲繞過 robots.txt 與 WAF 限制,仍成功抓取原本禁止擷取的內容。此舉不僅違背 RFC 9309 所訂網路共識,也衝擊網站對合法爬蟲的基本信任機制。

換句話說,Perplexity 在被網站擋下後,沒有守規矩地停止,而是讓一支假扮成一般 Chrome 瀏覽器 的爬蟲再偷偷抓取資料。

Cloudflare指出,包括PerplexityBot和Perplexity-User兩種爬蟲,會忽視網站寫在 robots.txt 裏面「禁止抓資料」的指令,連 WAF(Web 應用程式防火牆)的封鎖也設法繞開。

結果就是: 網站原本不想被抓走的內容,仍被抓走;而這種故意違反網路約定(見 RFC 9309)的行為,會削弱網站對「守規矩的爬蟲都會自我標示、遵守限制」這套信任機制。

對於上述指控,Perplexity 發言人 Jesse Dwyer 反駁稱相關貼文只是 Cloudflare 的「銷售話術」,並否認爬蟲為自家所有。不過,Perplexity 去年確實因《Wired》等媒體指其未經授權引用全文而陷入「抄襲」爭議,執行長 Aravind Srinivas 也被質疑對「抄襲」定義語焉不詳。

Cloudflare 近月祭出「AI爬蟲按次付費」功能,讓出版社與網站能為資料存取設定明確定價;同時在旗下免費「Bot Fight Mode」新增 AI-bot 專用封鎖規則,網站只需一鍵即可拒絕或限速未付費的爬蟲,藉此把「給錢才給料」的談判主導權拉回內容擁有者。

Cloudflare如何抓包Perplexity?

Cloudflare 先接獲多家客戶反映,指出即便已在「禁止機器抓取」的 robots.txt 檔案與防火牆(WAF)中封鎖 Perplexity 的官方爬蟲,網站內容仍遭擷取。公司先行確認客戶設定無誤後,進一步購買數個全新且對外完全隱藏的測試網域,並在其中同樣下達「全面禁止爬蟲」指令。

接著,Cloudflare 直接向 Perplexity 詢問這些測試網域的內容,結果卻收到詳盡回答,證實有未經宣告的爬蟲進入。最後,Cloudflare 透過流量分析比對,發現這批爬蟲假冒一般瀏覽器身分,每日仍對全球網站發送約兩千萬次請求,且頻繁更換 IP 與網路識別碼。

綜合上述三項證據,Cloudflare 認定 Perplexity違反公開爬蟲規範,隨即取消其「已驗證機器人」資格並將相關流量列入封鎖清單。

Cloudflare抓包Perplexity.jpeg
這張圖解釋了 Perplexity 的「官方→偽裝→重試」路徑與每一步判斷條件,凸顯其繞過網站保護機制的行為模式。
圖/ Cloudflare

Perplexity 遭剔除「已驗證機器人」名單

Cloudflare 隨即將 Perplexity 剔除「已驗證機器人」名單,並於所有方案推送新簽章,協助站點自動阻擋或挑戰此類隱形爬蟲。公司同時呼籲業者遵守「透明、節制、單一目的」等五大善意爬蟲原則,並與 IETF 共同推動擴充版 robots.txt。

官方亦肯定 OpenAI (開放人工智慧) 旗下 ChatGPT-User 嚴格尊重封鎖指令,並採用 Web Bot Auth 身分簽章,作為業界良好示範。

Perplexity反嗆:我看你是完全不懂AI助理

針對Cloudflare指控,Perplexity在X聲明反擊,直言傳統網路爬蟲(bot)與現代AI助理(agent)的本質不同。傳統爬蟲會自動、大規模地抓取網頁內容並建立資料庫,而AI助理(如Perplexity)則是根據用戶即時需求,臨時抓取並回應,不會儲存或用於訓練。

Perplexity強調其「user-driven agent」只在用戶發出請求時才抓取內容,且僅用於當下回答,不會長期保存或訓練模型。

Perplexity批評Cloudflare將AI助理誤認為惡意bot,認為這種做法會傷害用戶權益,阻礙資訊自由流通,甚至可能影響如醫療、新聞等重要資訊的取得。

聲明指出,Cloudflare在技術分析上有重大錯誤,將第三方流量誤歸因於Perplexity,並發布不正確的技術圖示,顯示其對現代AI助理運作方式缺乏理解。

Perplexity認為,若基礎設施供應商無法區分合法AI助理與惡意爬蟲,將危及開放網路的創新與用戶選擇權。

合規爬蟲的5大原則

依據 Cloudflare 的說明,守規矩的爬蟲至少符合下列五項原則:

  • 透明 (Transparency)
    主動標示專屬的 User-Agent,公開 IP 範圍或使用 Web Bot Auth 驗證,並附上聯絡資訊,便於站方追蹤與溝通。
  • 克制 (Good Netizenship)
    不大量灌流量、不抓取敏感資料,也不使用隱藏或偽裝手段規避偵測。
  • 明確目的 (Clear Purpose)
    每一隻爬蟲都應說清楚用於哪項服務,例如語音助理、比價、無障礙輔助等,讓站方能判斷是否開放。
  • 分工清楚 (Separate Bots for Separate Activities)
    不同功能用不同爬蟲執行,避免讓站方陷入「全開或全關」的兩難。
  • 遵守規則 (Follow the Rules)
    必須檢查並尊重 robots.txt、維持合理速率,且不得繞過 WAF 或其他安全防護。

這五條囊括了對網站「可辨識、可控管、可信任」的核心要求,亦是 Cloudflare 評定爬蟲是否值得授予「已驗證機器人」資格的依據。

延伸閱讀:Lawsnote為什麼「判4年、賠1億」那麼重?律師解讀一審判決:爬蟲到底行不行?
影片|6萬次爬蟲只換來1次點擊!AI搜尋促成「流量大斷崖」:Google如何改寫搜尋行規?

資料來源:CloudflareTechChurch

本文初稿為AI編撰,整理.編輯/ 李先泰

往下滑看下一篇文章
Meet大南方2026徵展啟動,免費早鳥席次6/8截止!6大解方區直球接傳產、ESG、醫療照護痛點
Meet大南方2026徵展啟動,免費早鳥席次6/8截止!6大解方區直球接傳產、ESG、醫療照護痛點

Meet大南方2026不是一場讓你「露個臉、拿名片」的展會。
Meet大南方2026是一場讓你「找到真正客戶」的展會。

2025年,我們用一組數字證明了這件事:雙日觀展近1.3萬人次、290+組團隊參展、促成352組商機媒合。這個媒合數字是2024年的2.7倍。同一批展商、同一個場地,媒合效率在一年內跳了一個量級。

這代表什麼?意味著來到Meet大南方的人, 越來越不是來「逛展」,而是來「談生意」。

過去5年的經驗,我們有了一個心得,南台灣的企業主不是來聽矽谷故事的,他們是帶著明確的問題走進展場。

#0 2026Meet大南方徵展
2025 Meet大南方吸引近300家新創參展,雙日觀展近1.3萬人次。
圖/ Meet創業小聚

所以今年,我們不再單純以「趨勢」和「創業」為號召,正式把展會定位為「Meet Your Best Solution」。不談空泛願景、不畫技術大餅,而是把AI應用、智慧製造、ESG碳管理這些詞彙,翻譯成每一位企業主聽得懂的語言、用得上的解方。

對解方提供商意味著什麼?代表來到你攤位前的人並不是路人,極有可能就是來找答案的老闆。

為什麼你應該來?因為這是「南台灣市場的稀缺入口」

2026年8月28日(五)至29日(六),Meet大南方將於高雄展覽館展開第6屆展會,並於即日起正式啟動招商。

對正在開發南部市場的解方商來說,Meet大南方不只是「一次曝光機會」,還代表以下4件事:

第一,精準接觸南部企業決策者
傳產老闆、二代接班人、廠長、中小企業主……這些人平常不會出現在台北的科技活動,也很難透過線上管道觸及。為了把這群人真正拉到展會現場,過去幾個月《創業小聚》每月固定南下舉辦實體小聚,攜手高雄市經濟發展協會、高雄市建築經營協會、高雄市青年企業家協會與中山EMBA等組織,一場一場把在地企業主凝聚成一個社群。這群人不是展會當天才第一次聽到Meet大南方,他們早已是Meet大南方的一份子。

第二,從cold mail到warm lead的捷徑
兩天展期裡,除了攤位對話,我們會透過企業媒合會、投資人媒合會、新創交流之夜等機制,主動把你和潛在客戶、投資人湊到同一張桌子上。2025年這套機制為展商促成352組商機媒合,是前一年的2.7倍。現場示範、現場對話、現場加LINE,一次抵過3個月的線上開發。

#2 2026Meet大南方徵展
南台灣的企業主帶著明確的問題走進展場,找他們最迫切需要的解方。
圖/ Meet創業小聚

第三,解方區分類帶來精準人流
6大解方區依照企業痛點分類,觀展者按需求找到對應展區。來到你攤位的人,不會只有過路客,也有正在找你這類解方的決策者。

第四,南部市場的最低成本試水溫
對想評估是否投入南部市場的團隊,到高雄準備一個攤位的成本,遠低於派業務長駐南下3個月。2天內,你會得到足以判斷市場值不值得投入的第一手資訊。

值得一提的是,2025年Meet大南方的媒體曝光總效益超過新台幣3,000萬元,涵蓋《工商時報》、《經濟日報》、《數位時代》等91家媒體、共323則網路新聞露出。展商的品牌能量會自然搭上這波媒體浪潮。雖然這不該是你來的主要理由,但它確實是附贈的。

六大解方區:每一區都是一組企業痛點

今年我們把展區濃縮為6大「解方區」,每一區都直球對應一組具體的企業痛點:

智慧製造與產線升級 解方區——給自動化設備、AOI/AI視覺檢測、MES、工業物聯網、系統整合的團隊。對應痛點:缺工、良率不穩、設備老舊、排程沒效率。

數位管理與企業效率 解方區——給ERP/CRM/HRM、AI Agent、AI辦公工具、RPA、SaaS、FinTech支付、資安的團隊。這是最跨產業的一區,涵蓋所有企業的效率需求。

醫療健康與高齡照護 解方區——給遠距醫療、AI診斷、長照科技、健康數據、醫療管理系統的團隊。對應高齡化社會下的照護人力缺口與醫療數位化缺口。

#1 2026Meet大南方徵展
今年策劃6大「解方展區」,直接對應企業經營現場最常見的問題情境。
圖/ Meet創業小聚

淨零碳排與綠能永續 解方區——給碳盤查SaaS、ESG顧問工具、綠能設備、能源管理系統、循環經濟的團隊。供應鏈碳足跡要求已經壓到南部製造業頭上,這一區的需求只會愈來愈急。

品牌轉型與跨境行銷 解方區——給電商平台、跨境物流、MarTech、AI行銷工具、品牌顧問的團隊。南部有太多做代工做到品牌老化、想做電商卻不知從何開始的業者。

未來零售與餐飲科技 解方區——給POS、餐飲SaaS、無人商店、會員CRM、供應鏈方案的團隊。搭配「大南方餐飲創業沙龍」同步導流。

方案與招商資訊

2026 Meet Greater South亞灣新創大南方
時間:8/28(五)、8/29(六)
地點:高雄展覽館北館
官網:https://meetgreatersouth.tw/

徵展正式起跑,新創享專屬免費方案!
早鳥優惠至6/8,報名收件至7/3  >> 瞭解詳情

報名採審核制。請至Meet Online更新公司資料及填寫參展報名表單,主辦單位將以Email通知審核結果。若您的解方尚在評估是否合適,歡迎先聯繫我們,一起確認哪一個解方區最貼近你的目標客戶。

企業帶著問題來,我們希望你帶著解方來。
8月28-29日,高雄展覽館見。

#1 2026Meet大南方徵展
今年Meet大南方將於8/28、8/29在高雄展覽館盛大舉辦,現已開放參展報名。
圖/ Meet創業小聚
關鍵字: #創新創業

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓