Deep Research怎麼用?GPT、Perplexity、Grok大評測:誰最強?誰CP值最高?
Deep Research怎麼用?GPT、Perplexity、Grok大評測:誰最強?誰CP值最高?

各大科技巨頭近期紛紛推出DeepResearch功能,通常標榜了先進的資訊蒐集、分析與報告生成能力,但實際使用起來,究竟哪裡不一樣?

2025年1月底,中國DeepSeek問世可說是為了這場AI競賽擊發了起跑第一槍,基於R1模型的DeepResearch功能驚豔各界,更挑戰了美國在AI領域的技術主導地位。

事實上,Google最早於去年12月初率先推出基於Gemini 1.5 Pro模型的DeepResearch功能。而在DeepSeek後,包括OpenAI、Perplexity,以及由特斯拉創辦人馬斯克旗下xAI所發布的Grok3模型,陸續在2月份發布「深度研究」功能。

那麼,各家的DeepResearch功能差異為何?

《數位時代》以下將以「檔案解讀」及「開放式提問」兩大題,針對各家模型進行資料搜尋的「廣度」、「深度」、「可讀性」等維度進行整體評分,來看看對於慣用繁體中文的台灣用戶來說,哪一家的產品最實用。

要先說明的是,以下測試檔案解讀皆採用主計總處的「2024全年及12月的工業及服務業薪資統計結果」,該檔案一共34頁,並包含大量行業薪資數據。而提示詞為: 「請就檔案內容提出關鍵洞察」 ,旨在利用相對抽象的提問測試各模型對用戶需求的理解程度。

而「開放式提問」,則以歸納國內外新聞為題,具體提示詞為: 「請協助整理至今30天內的國際&台灣10大新聞」 ,旨在測試各家模型的搜尋廣度以及理解深度。

註:本次由於DeepSeek過程中一直呈現過載狀態,故未納入評測。

選手一:ChatGPT(GPT 4.5)

ChatGPT部分以GPT 4.5模型為測試,在上傳檔案之後並輸入提示詞之後,約莫在30秒之內生成出七項洞察要點。其中,較為關鍵的訊息包括「全體受僱員工的經常性薪資」,以及「12月總薪資的平均數」,均在第一點出現。

但針對薪資分布差距,僅列出中位數及年增率,雖有提到「第9十分位」與「第1十分位」比值,但卻未列出檔案中的具體數據,必須追問「請提出具體數據」才可撈出數據;行業別薪資差異部分,也僅列出最高薪行業(金融業)及部分高薪行業;而對「低薪行業」的描述則更少。

GPT4.5.jpg
ChatGPT 4.5的生成速度快,但在沒有精確提示的情況下,論述深度有賴用戶進一步提問強化。
圖/ ChatGPT

在加分項上追問「請協助列出各產業薪資中位數排名」, ChatGPT所列出的分數並未完全依照高低排列,需要用戶進一步整理才可使用 ;除此之外,在評測時雖然輸入繁中提示詞,原始資料也是中文,但ChatGPT多次都以英文回覆,需要請他「說中文」,才會把生成結果翻譯成中文。

GPT排名.jpg
要求GPT 4.5整理數據排名,有子母項目混用的問題,導致數據未依照高低排序。
圖/ ChatGPT

而在新聞搜尋方面,GPT確實有理解「至今30天內」為2025年2月10日至3月12日, 但在新聞內容上信度頗低,有過度簡化(例如:全球通脹壓力持續,多國面臨高通脹率),甚至是引用維基百科,把2024年的花蓮強震當作新聞露出。

選手二:Perplexity(DeepResearch)

Perplexity的深度搜尋特色是生成內容結構化完整,更像是由人類寫出來的報告。舉例而言,包括經常性薪資平均數及成長率,以及成長因素,再到各產業差異發展,論述的架構要更為理想。另外,夾帶檔案後的生成時間約莫在30秒以內。

值得注意的是,Perplexity會自動在各標題上產生連結,方便用戶點擊,針對有興趣深入研究的項目進一步追問,相較ChatGPT更為人性化。

per結構.jpg
Perplexity深度研究的論述結構完整。
圖/ Perplexity

而在加分項上追問「請協助列出各產業薪資中位數排名」, Perplexity就會自動歸納檔案中的表格,並附上「中位數/平均數比」,以及各產業年增率,甚至提出「前三大高薪產業占總受僱人數僅8.74%」等更深入經過推論的洞察 。但Perplexity的表格僅列出薪資中位數前12高,同時仍有部分排名錯置的問題(更低的排名卻較高),不過正確性無誤。

per中位數排名.jpg
Perplexity整理的表格各自正確性無誤,但排名未依照高低順序。
圖/ Perplexity

而在新聞搜尋方面,Perplexity對國際新聞的表現比台灣本地新聞更理想,前五條確實為近一個月內的國際要聞,但第六名之後就有報題重複,以及納入2024年末新聞的狀況;台灣新聞方面,可從引用資料察覺AI大量引用國內媒體的2024年回顧新聞,因此時效性幾乎都與提示詞不太吻合。

per國際新聞.jpg
Perplexity的國際新聞排名,多為政治經濟議題。
圖/ Perplexity

選手三:Gemini(DeepResearch with 2.5 Pro)

實測時發現, Gemini的DeepResearch無法夾帶檔案(測試帳號為Advanced版) ,因此改用唯一可夾帶PDF檔的模型2.0 flash進行測試。

結果發現,Gemini的生成結果類似GPT 4.5,採以列點的方式將重點摘要出來,雖在資料正確性上無誤,但並未將大量資料結構化,導致可讀性偏低,若用戶本身對於這類型資料沒有基礎概念,不容易在生成結果上產生深入洞察。

GEM檔案輸出.jpg
Gemini的資料處理能力與ChatGPT雷同,精準、快速,但深度不足。
圖/ Gemini

而在加分項上追問「請協助列出各產業薪資中位數排名」,Gemini確實依照金額高低,將列入統計數據逐一列點排出。

值得注意的是,由於原檔案內有部分產業分成母項與子項, 例如「批發及零售業」底下,還可細分為「批發」及「零售」兩項,而Gemini選擇將母項(兩項子項加總)排除,因此在排名上更為直觀,也是在加分項上贏過CahtGPT的關鍵。

GEM加分.jpg
Gemini重組資訊的能力尚算可靠,用戶可進一步提示優化。
圖/ Gemini

而在新聞搜尋方面切換回DeepResearch,Gemini的亮點是,可以在生成結果之前「編輯研究計畫」,Gemini會列出研究題目的各種項目,協助用戶提出更精確的研究架構。而若回應「不用更動」,就會依照計畫生成結果。

GEM計畫.jpg
Gemini可以再生成前優化提示,或可取得更好的成果。
圖/ Gemini

生成出爐後,Gemini的優勢是與Google文件整合度高,因此可以直接將成果輸出,方便用戶取用。 但第一版生成結果雖以中文提問,卻是以日文顯示成果,必須進一步請AI顯示中文。(應與引用資料為日文有關)

而在新聞選擇上,國際新聞的時效性更為精準,主題大多以地緣衝突與選舉為主。 這點可以從引用資料來源有限觀察到,Gemini生成國際要聞僅引用3條來源,應該是主題雷同的關鍵 ;而在台灣新聞方面,一貫的引用舊文、過度簡化問題也有發生,甚至有蘇貞昌擔任行政院長時期的新聞。

Gemini新聞.jpg
Gemini歸納新聞的能力有待加強。
圖/ Gemini

選手四:Grok(Grok 3)

在夾帶檔案之後,Grok的特色是會跑出一連串的推論過程(Perplexity也有這個過程),可發現AI確實一步一步的透過提示詞擬定生成內容,並有強調「必須驗證關鍵訊息」。 但Grok生成也耗時相對久,前後約為4分鐘。

首先,Grok的資料結構化功能相當完整,內容優先擷取關鍵訊息,包括「薪資增長」、「行業差異」與「就業動態」,並在往下的篇章逐一描述原因。例如: 「住宿和餐飲業薪資最低,為30,960新台幣,反映了非典型員工比例較高的影響。」

GROK洞察.jpg
Grok的資料結構能力,與Perplexity相當,甚至更理想一些。
圖/ Grok

令人眼睛一亮的是,Grok生成的第二部分是「詳細報告」,其中針對「行業特定數據」進行分析(在沒有進一步提問的情況下),自動將「中位數經常性薪資」依照高低排名,並附上年增率數據(但部分產業數據有遺漏),內文也有進一步高薪行業的背景因素概略說明。

GROK薪資中位數.jpg
Grok的初次生成結果不俗,但部分資料有遺漏問題。
圖/ Grok

而在加分項上追問「請協助列出各產業薪資中位數排名」,Grok在推論接近10分鐘後仍未產出結果。經查詢推論過程, Grok卡關的關鍵在於無法理解中文「中位數」跟「平均數」的定義,而被AI認為是相同的值而產生混亂。

在經過將近13分鐘的推論後, Grok列出一份清單,但「中位數」與「平均數」混淆的問題並未解決。經過思維過程查詢,該表中的「年增率」是Grok利用各產業2024年每個月的總表推論運算而成。 雖然Grok疑似因中文能力而造成錯誤推論,但其推論功能令人眼睛為之一亮。

GROK行業排.jpg
Grok雖然沒有生成正確的表格,但推論過程顯示了改善中文問題後的潛力。
圖/ Grok

來到新聞搜尋環節,Grok與其他AI模型差異頗大,它在新聞篩選上首先考慮了選材多元性。在國際新聞上,烏俄停火被認為是最大頭條,而德州野火則被選為第二名。第三名以後陸續有AI突破、美股下跌等要聞,但與其他家模型一致的是有過度簡化描述的問題,導致參考度不高。

而在台灣新聞方面,Grok甚至指出 「假設3月有總統選舉,結果可能主導新聞走向」 ,可以說凸顯Grok活躍的推論能力,反而可能導致蒐集客觀訊息的能力存在重大偏差。就結論上來說,一樣是國際新聞比台灣新聞更具參考性。

GROK台灣新聞.jpg
Grok在新聞歸納上不盡理想。
圖/ Grok

結論:Perplexity最泛用、Grok推論活躍、Gemini與ChatGPT持平

根據測試結果,各模型在「廣度」、「深度」及「可讀性」三個維度上各有優劣:

ChatGPT(GPT 4.5)

優勢 :反應速度偏快,生成內容重點清楚無誤,數據準確性高。

劣勢 :資料結構性偏低,且對繁體中文支持不足(需多次提醒使用中文),新聞搜尋時效性不佳。

適用場景 :適合需要快速獲取概要資訊的用戶,但對深度研究需求較高者可能不夠理想。

Perplexity(DeepResearch)

優勢 :生成內容結構化程度高,提供深入洞察,且自動生成表格輔助理解,頗為好用。

劣勢 :部分排名仍有錯置問題,台灣本地新聞時效性較差。

適用場景 :適合需要結構化報告與深入分析的用戶。

Gemini(2.0 flash + 1.5 Pro)

優勢 :資料正確性高,生成結果直觀,且可手動優化提示詞,與Google生態系統整合度佳。

劣勢 :無法處理複雜結構化數據,搜尋廣度略低,可讀性較低。

適用場景 :適合簡單資料整理,與重度Google生態系用戶。

Grok(Grok 3)

優勢 :推論過程透明,資料結構化能力最強,且具備活躍推論能力,潛力可期。

劣勢 :處理速度相對慢,對中文詞彙的理解存在偏差,比其他模型明顯更差。

適用場景 :適合需要透明推論過程與多元視角的用戶,但需容忍較長生成時間。

若從訂閱費的CP值角度出發, 目前Gemini、Grok、Perplexity都開放免費用戶試用Deep Research功能 。至於ChatGPT則僅開放Plus方案以上用戶使用,得購買每月20美元方案才能解鎖。

Gemini、Grok、Perplexity雖開放免費使用,但要注意的是次數有限,且有上下文窗口的token限制;目前,Gemini advanced可透過訂閱「Google One AI」使用,月費為新台幣650元;Perplexity Pro訂閱費也是每月20美元;Grok的超級方案則為每月30美元。

不能只靠AI!「人機協作」是優化關鍵

而在評測4家深度搜尋功能後,可以確定的是,目前AI工具的最大貢獻在於免於人類一次性的讀取大量資料,並從中歸納出重要數據,或是代勞部分製表的工作時間,對於需要快速產出數據精華的用戶而言,十分實用。

但在資訊歸納上,AI的資料結構化能力仍有待加強,尤其是在提示詞較為模糊的情況下,會讓AI的推論能力難以發揮;除此之外,AI在梳理資料或是推論上,仍有不低的機率產生錯誤,因此逐一查核數據正確性非常重要。

因此,若用戶要對資料提出更深入的洞察與詮釋,建議還是在充分閱讀資料後,不斷與AI對話並隨之調整提示詞,才可獲得更理想的成果。

最後必須聲明,這份評測是在相當有限的條件限制下推導出來的結果。換言之,任何人使用不同提示詞,都可能會得到更理想的結果,故本文的評測結果有一定侷限。

延伸閱讀:台積電傳找輝達、AMD、博通「合資經營」英特爾!台積持股比率不超過50%
影片|Perplexity教學|讓資料搜尋更簡單的AI!免費版Perplexity怎麼用?4大優點、中文設定一次看

責任編輯:李先泰

本文不開放轉載

往下滑看下一篇文章
AI造浪席捲跨境電商!亞馬遜揭「科技、價值、信任」三大趨勢,引領台灣企業搶賺全球商機
AI造浪席捲跨境電商!亞馬遜揭「科技、價值、信任」三大趨勢,引領台灣企業搶賺全球商機

台灣有無數「隱形冠軍」和世界級的製造實力,在各大產業中閃閃發光。但面對全球供應鏈重組、消費習慣碎片化,以及近年生成式AI的爆發性成長,台灣企業該如何將優質的硬實力,轉化為知名的品牌力?

為了因應相關議題,協助台灣中小企業尋找突破口,2026亞馬遜全球開店博覽會以「AI造浪,品牌出海」為主軸,舉辦豐富的講座、實際體驗和諮詢服務,吸引眾多渴望轉型出海、對進軍全球市場有強烈企圖的企業和品牌,共同與會。

代理式AI崛起,重塑購物旅程、企業營運模式

在開場講座中,亞馬遜全球開店台灣總經理謝孜希首先以「從台灣到全球,AI時代品牌跨境突圍實戰」為題指出,跨境電商已經從過去的「流量競爭」,正式進入「數據和智能驅動」的根本性轉變,「AI不只是輔助工具,還在全面重塑消費者的購物旅程和企業的營運模式,尤其『代理式AI』(Agentic AI)的崛起,將成為品牌連結全球消費者的關鍵。」她進一步解釋,過去的AI像被動的指令接收器,人下指令、AI接著執行;但現在的代理式AI,更像企業的營運夥伴、顧客的購物助理,能主動分析市場、規劃策略、自動執行任務,並在找出消費者的喜好自動下單。

amazon-2.jpeg
亞馬遜全球開店台灣總經理謝孜希表示:「AI不只是輔助工具,還在全面重塑消費者的購物旅程和企業的營運模式,尤其『代理式AI』(Agentic AI)的崛起,將成為品牌連結全球消費者的關鍵。」
圖/ Amazon

在亞馬遜上,Agentic AI讓消費者從普及的應用AI來搜尋,再到比較決策、進而購買商品。比方說,亞馬遜的購物助理Rufus AI,能根據消費者的搜尋動作判斷意圖,主動推薦商品,這讓使用Rufus AI的消費者,購買轉換率可比未使用的消費者提升逾60%,目前已有超過3億、97%的活躍用戶,透過Rufus AI進行消費決策。此外,亞馬遜還推出「Interests」功能,即使顧客不主動搜尋,這個AI私人購物助理也會24小時不間斷地幫忙逛街,並根據個人偏好推送新品、降價資訊,最終成功讓近20%的用戶,將推薦商品加入購物車。

謝孜希特別提到,亞馬遜的「Buy for Me」功能,已經從「資訊代理」進化成「行動代理」。根據最新數據統計,可以由AI代為完成購物的跨平台商品,已經超過50萬件,「這代表電商正從『關鍵字經濟』,變成『興趣經濟』、『AI代理經濟』。」

在賣家端,AI同樣展現強大價值,謝孜希透露,目前已有高達90萬名賣家導入亞馬遜的AI工具,包括能協助找出仍未被滿足需求的「商機探測器」、自動生成符合當地生活風格品牌場景圖的「A+內容」,以及能自動優化廣告素材的Ads Agent和Creative Agent等工具。這些代理式AI工具,平均每週能為賣家節省約5.6小時的時間,「賣家能將寶貴的時間,專注在更高價值的品牌決策和產品創新上。」

聚焦全球三大消費趨勢,台灣品牌迎來絕佳出海契機

了解AI如何改變規則後,謝孜希進一步分析,現今的全球消費趨勢,分別為高科技研發升級體驗、價值創新打造爆品和安全信任建立品牌,「這三大趨勢和台灣企業在技術、創新、品質上的優勢,完美契合。」

首先,當前全球消費電子市場規模已突破一兆美元,其中搭載AI的消費電子產品成長速度,更是整體消費電子市場的5倍。而台灣擁有全球最完整的PC和電子零組件供應鏈,占全球先進製程晶片製造的90%;根據財政部統計處2026年3月的最新統計,資通訊加電子零組件則占出口近八成。謝孜希以賣家「TRYX創氪星系」為例,指出品牌看準PC DIY市場長期陷入CP值和價格戰的痛點,決定專注高階玩家,推出全球首款「裸眼3D水冷散熱器」和L型曲面螢幕機箱,「TRYX創氪星系不跟風做低價競爭,反而善用亞馬遜商機探測器,預判消費者的需求,再用『技術』重新定義品類,並透過評論工具Vine快速建立信任。」進軍亞馬遜短短一年內,TRYX創氪星系的營收便成長了197%。

amazon-3.jpeg
「TRYX創氪星系」成長旅程,進軍亞馬遜短短一年內,TRYX創氪星系的營收便成長了197%。
圖/ Amazon

其次,消費者不再單純要求「低價」,轉而追求「超出期待的體驗」和「價值」。根據Deloitte的調查顯示,當品牌兼具創新力和信賴感時,消費者的年均支出會提升62%,且有近六成消費者願意為創新永續的產品付更多錢。健身器材熱銷全球80多國、累積千萬台銷量的居家健身品牌WONDER CORE,就是最佳的價值創新典範。

早在2009年,WONDER CORE就發現現代人居住空間變小,轉而開始研發小型健身器材,鑽研「讓健康變簡單」的解決方案。如今,WONDER CORE已有逾200項專利,更將硬體結合專屬APP,透過AI分析運動、飲食數據,提供客製化課程給消費者。

amazon-4.jpeg
累積千萬台銷量的居家健身品牌WONDER CORE,已有逾200項專利,將硬體結合專屬APP,透過AI分析運動、飲食數據,提供客製化課程給消費者。
圖/ Amazon

至於在年產值逾5500億美元的母嬰、寵物等市場,讓消費者買單的重點,是「安全」與「信任」。高達73%的消費者認為,品牌信任是影響忠誠度的首要因素,忠誠客戶的消費金額較一般消費者高出31%,回購率也大幅提升。台灣寵物品牌「超凝小姐Lady N」掌握安全、信任等要素,專注研發高品質的天然豆腐貓砂,便首創使用國際安全香氛協會認證的安全香氛,打破市場對香味貓砂不安全的刻板印象。儘管剛進美國市場前三個月的訂單只有個位數,但透過優質體驗帶來的口碑效應,曾創下24小時內狂銷數十箱的紀錄,以及10倍的銷售成長、高達60%的回購率。

amazon-5.jpeg
台灣寵物品牌「超凝小姐Lady N」專注研發高品質的天然豆腐貓砂,便首創使用國際安全香氛協會認證的安全香氛,打破市場對香味貓砂不安全的刻板印象。透過優質體驗帶來的口碑效應,曾創下24小時內狂銷數十箱的紀錄,以及10倍的銷售成長、高達60%的回購率。
圖/ Amazon

「AI結合品牌力,就是取得全球成功的方程式。」謝孜希鼓勵台灣企業善用亞馬遜的AI選品、代理式AI等工具,用數據驅動決策、掌握高成長品類,並從「Day 1」起,就具備建立國際品牌的視野,讓AI成為走向全球的加速器。

跨界對談傳授出海心法,善用數據、驅動決策

另外,博覽會還安排了由《數位時代》創新長黃亮崢主持,亞馬遜全球開店台灣總經理謝孜希、台北市進出口商業同業公會秘書長黃文榮、安克創新副總裁暨海翼電商執行長吳灼輝、嘖室營運長高立杰等專家,從不同角度探討企業的出海痛點並剖析各種AI應用。

amazon-6.jpg
由左至右,分別為嘖室營運長高立杰、安克創新副總裁暨海翼電商執行長吳灼輝、亞馬遜全球開店台灣總經理謝孜希、台北市進出口商業同業公會秘書長黃文榮共同與會、分享,並由《數位時代》創新長黃亮崢主持。
圖/ 數位時代

高立杰建議,剛起步的品牌在使用任何AI工具前,都應該先「認識自己」並「釐清品牌定位」。他指出品牌洞察到年輕人不喜歡被傳統業務推銷的痛點,因此創造了「被動式」、「無壓力」的線上線下購物體驗,「AI可以幫你生成精美的圖片、文案,但如果品牌本身就缺乏靈魂,產出的素材依舊無法打動目標客群。」

黃文榮則提到,科技進步讓全球市場通路日益碎片化,導致傳統大客戶的訂單日益流失,許多OEM、ODM廠商被迫走上跨境電商之路,「所以現今企業的最大挑戰,是『轉變心態』。過去是客戶給規格照著做,現在得自己去面對廣大、多樣的消費者需求。」他建議,企業務必透過AI工具和市場同步,也必須自己培養跨界人才,同時,無論如何都要勇敢搭上數位轉型的列車,並善用亞馬遜全球開店等跨境電商產業資源。

而吳灼輝觀察,跨境電商已從過去的「單點工具」競爭,進化到「系統化AI營運」的時代。他認為,企業不應只把亞馬遜當成單純的銷售通路,更應視為獲取消費者回饋和洞察市場的「大數據中心」,並利用各項AI工具來提升決策效率,才能在激烈的市場競爭中,占據領先地位。

謝孜希總結指出,AI已降低全球化門檻,企業思維應從「品牌全球化」,轉變為營運第一天起就決心打造全球品牌,「不要等在地市場成熟才布局海外,應該善用AI,放大對消費者的理解和決策品質,加速走向世界,讓AI真正成為品牌邁向全球的加速器。」

除了各方專家分享的精實內容,此次博覽會還設置「亞馬遜AI算命館」、各項工具體驗和服務商展示專區,企業、品牌可以體驗亞馬遜全球開店最新的商機探測器、A+內容等AI工具,讓系統解讀自家的「產品命盤」,進而找出潛在商機;今年更增設跨境諮詢專區Seller Cafe,安排了專業的亞馬遜官方專家和跨境顧問,提供未註冊和剛註冊的新手、有廣告投放和行銷等進階問題的老賣家,一對一的實戰指導。

amazon-7.jpg
博覽會本次設置「亞馬遜AI算命館」,協助企業、品牌可以快速找到問題,並體驗亞馬遜全球開店最新的商機探測器、A+內容等AI工具,讓系統解讀自家的「產品命盤」,進而找出潛在商機。由左至右為:亞馬遜全球開店台灣總經理謝孜希、臺北市政府俞振華副秘書長。
圖/ 數位時代

值此AI造浪時代,亞馬遜全球開店博覽會透過趨勢剖析、台灣的成功賣家案例分享,以及各界專家的深度對談,為企業描繪了一張清晰的出海藍圖。台灣品牌只要能緊抓科技研發、價值創新、安全信任等三大優勢,再搭配亞馬遜的AI賦能工具與全球資源,相信能在全球航道上乘風破浪,持續寫下世界級的亮眼佳績。

立即下載_亞馬遜 2026 消費性電子品類攻略手冊|掌握下一波成長動能

圖/ Amazon

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓