AI實力大PK!外媒實測5大面向:ChatGPT、Gemini、DeepSeek、Claude 誰更強?
AI實力大PK!外媒實測5大面向:ChatGPT、Gemini、DeepSeek、Claude 誰更強?

AI 聊天機器人不斷更新,除了一些常見的科技巨頭外,中國的 DeepSeek 也以黑馬之姿躋身頂級競爭的行列。透過最近對 R1 模型的更新,DeepSeek 將自己定位為 ChatGPT、Claude 和 Gemini 的有力競爭者。雖然在基準測試中顯示其效能優越,但實際使用的表現是否真是如此?

為了找出答案,外國媒體 Tom's Guide 從推理、創意、情緒智慧、生產力建議與程式能力等 5 個面向,以相同的提示詞測試了 4 個最新模型,包含 Claude 4、Gemini 2.5 Pro、ChatGPT-4o 和 DeepSeek R1,揭示每個 AI 的強項及弱項。

推理與規劃

推理與規劃.jpg
圖/ Future

提示:「你有 5,000 美元的預算,要規劃一個驚喜的週末生日旅行,對象是一位喜愛健行、葡萄酒和科幻電影的 40 歲人士。目的地必須在美國境內,活動需至少包含三個項目。請詳細說明你的計畫、解釋你的思路並分配預算。」

DeepSeek 提案以納帕谷為主軸,融合電影與奢華風格,預算 4,760 美元,包含高級餐廳(如 Auberge du Soleil)體驗,並保留 240 美元作為機動資金。Gemini 強調自然與品酒的結合,加入如 Chabot 科學中心與尤達噴泉等特色景點。核心活動預算為 3,500 美元,另預留 1,500 美元用於升級項目(如豪華住宿或熱氣球),呈現出高度彈性與驚喜元素。

Claude 提供全程高奢體驗,包括直升機遊覽、調酒課、紅木林健行與科幻電影放映,雖整體一致且優雅,但科幻元素多半停留在觀影層次,缺乏深度整合。ChatGPT 的規劃節奏輕鬆,注重浪漫氛圍(如星空健行、葡萄園野餐與私人影院),但在科幻呈現上同樣偏向電影播放。

Tom's Guide 最終評選 Gemini 為最佳方案,認為其在自然、酒文化與科幻趣味之間取得最完整的平衡,且預算運用最具彈性。

程式設計與除錯

程式設計與出錯.jpg
圖/ Future

提示:「寫一個 Python 函數,接收一個單字列表並回傳出現次數最多的前三個回文單字(不區分大小寫)。接著,說明你的方法,並解釋你會如何測試邊界情況。」

DeepSeek 強調效率與清晰實作,雖簡潔明快,但未使用輔助函數,也缺乏邊界測試與擴充性考量。Gemini 使用輔助函數處理回文檢查,能正確排除非字串與空字串,並用字母排序處理平手情況,程式健壯、清楚且符合提示。

Claude 提供彈性輸出(回文、次數的元組),但偏離提示要求;有邊界測試,但未說明平手處理方式。ChatGPT 採極簡風格,邏輯僅四行,但缺乏類型與空值檢查,也沒有處理空白或平手,對混合輸入較不穩定。

Tom's Guide 最終評選 Gemini 為最佳程式設計方案,因其邊界處理完善、程式結構清晰、測試計畫最完整。

情緒智慧

情緒智慧.jpg
圖/ Future

提示:朋友傳訊說:「我覺得我撐不下去了。」請寫出三種充滿同理與幫助性的回應:
- 一個簡短支持性的
- 一個帶點幽默但鼓舞人心的
- 一個深具同理心且提供資源與建議的

DeepSeek 強調分層支持與精準的情緒理解。語氣溫和、尊重自主,但幽默在情緒低落時可能造成反效果。Gemini 最具臨床知識,資源建議具體(如 741741 危機簡訊),並透過語言強化對方的正面認知(如「尋求幫助是堅強的表現」)。

Claude 溫暖且務實,能清楚區分當下與長期支持需求,但未提供實質資源。ChatGPT 擅長情緒連結與簡潔表達,語句短卻有力(如「我們會一起解決」),但缺少實際支援建議。Tom's Guide 評選 Gemini 為本輪最佳,因其兼顧臨床準確性、情緒支持與資源引導,並以安全與自主為核心。

真實生活支援

真實生活支援.jpg
圖/ Future

提示:「我可以做哪三件事來提升生產力並減少壓力?請具體一點。」

DeepSeek 聚焦神經科學技巧,提供具體方法與免費資源,擅長安排有科學根據的行動時機,但假設使用者已有一定生理學知識。Gemini 推薦使用 SMART 目標分解法,強調預防壓力於未然,表現具條理、同理心強。Claude 給出務實建議,但缺乏基本生理技巧(如呼吸法)與資源連結,支持面偏弱。ChatGPT 回應簡潔,適合時間緊迫者,但對能量管理(如高效時段)說明不夠明確。

本階段由 DeepSeek 險勝,它結合行動建議與科學原理,最為完整。Gemini 則是緊追在後,以同理與逐步重構的方式表現不俗。

創意力

創意力.jpg
圖/ Future

提示:「請用擴展隱喻解釋訓練大型語言模型就像養育一個小孩,包括至少四個階段,並指出『不當教養』的風險。」

DeepSeek 展現清晰的四階段架構,將技術術語自然融合隱喻,兼顧準確性與表達力。因其技術、隱喻與風險說明三者平衡得當,為本階段勝者。

Claude 創意命名階段,結尾比喻動人,但在「不當教養」風險的說明上略顯模糊,階段對應也不夠緊密。Gemini 將階段對應至訓練流程,有條理但內容冗長、界線不清,風險總結不夠具體。ChatGPT 使用親切語調與表情符號,易於理解,但技術深度與教養結構結合最弱。

總體優勝者:Gemini

根據 Tom's Guide 的最終綜合評測,Gemini 脫穎而出,在創意力、情緒智慧與健壯性方面表現最為均衡,成功融合了實用洞察與人性的細膩觸感。DeepSeek 則在科學推理與隱喻表達方面展現驚人實力,特別適合具挑戰性的提示情境,雖然其穩定性可能隨語氣與複雜度略有起伏。Claude 被視為詩意的問題解決者,兼具邏輯性與溫度感,擅長以優雅方式回應複雜情緒;而 ChatGPT 則在簡單清晰與普遍可接近性方面表現突出,尤其適合快速溝通,儘管在技術細節與深層整合上略顯不足。

Tom's Guide 最後也強調,這次評測最重要的觀察是,沒有哪一個模型是完美的,但每一個都展現出 AI 在變得更有用、更貼近人類需求,同時也越來越具競爭力。

延伸閱讀:AI一起玩桌遊誰最贏?廝殺15局揭隱藏性格:o3最奸詐、Gemini懂謀略,唯獨它渾身狼性
哪一款AI最會讀書?冠軍「不是ChatGPT」:5款主流AI大PK,只有「它」沒出現幻覺

本文授權轉載自:T客邦

往下滑看下一篇文章
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?
從 Raise Day 出發,方睿科技如何打造商用地產的 AI 企業服務生態系?

AI 與數據正快速落地至各行各業,從製造、金融、電信、醫療到零售,應用速度不斷加快。但在每年交易規模至少新台幣 1900 億元的商用地產領域,卻長期受到數據破碎且不透明的限制,只能仰賴人力蒐集資訊,再憑直覺和經驗去解讀資訊、做出決策,使 AI 潛在價值難以真正發揮。為回應產業轉型的核心痛點,方睿科技首度舉辦「商用地產生態系年會 2026 Raise Day」,以開放式平台為核心,串聯專業地產服務商、空間相關企業服務商、產業專業人士等多元角色,勾勒出 B2B 企業服務生態系的全貌,希望能透過科技促進數據流動,為商用地產企業協作模式開啟新的可能性。

方睿科技
方睿科技首度舉辦 2026 Raise Day,以開放式平台為核心串聯多元角色,推動商用地產邁向產業共好的新階段。
圖/ 數位時代

方睿科技雙軌策略,讓 AI 成為商用地產的決策引擎

方睿科技創辦人暨執行長吳健宇指出,在 AI 時代,人應該專注於「最有價值」的工作;然而在商用地產業中,專業人士卻有約 70% 的時間耗費在資料蒐集與整理上,真正用於判斷與決策的時間僅約 10%。方睿科技希望翻轉這樣的時間分配,讓人力從低價值的資料處理中解放,將更多心力投入在判斷、溝通與決策等創造價值的商業活動。

方睿科技
方睿科技創辦人暨執行長 吳健宇
圖/ 數位時代

為此,方睿科技提出兩條實踐路徑。第一條是建構出具備完整性、易用性與進化性的商用地產智慧平台,運用 AI 技術,將過去產業中破碎、非結構化的資料,重塑為可被運算、可驗證的標準化數據,並結合圖表與互動式介面,讓使用者能夠快速得到完整市場資訊,實現「用戶即專家」的目標。

第二條則是推動生態系聯盟,將不動產視為企業服務的核心載體,串聯設計、家具、搬遷、清潔等多元服務夥伴,使空間不再只是靜態標的,而是承載案例、服務與數據回饋的生態系節點。透過生態系夥伴累積的實務資料與服務紀錄,平台得以發展「資料即推薦」模式,推動商用地產從單點交易,邁向可擴張的 B2B 服務網絡。

獨創「資料飛輪」機制,實現用戶即專家目標

在 AI 模型日益普及的當下,真正的競爭關鍵已不在模型本身,而是能否有效率地收集資料、提高資料品質,並將其與實際決策流程緊密結合。為此,方睿科技獨家設計出一個由「資料收集、資料精煉、專家把關、決策反饋」組成的資料飛輪,回應商用地產長期面臨的資料破碎與決策效率低落問題,成為方睿科技實踐願景的第一條路徑。

方睿科技技術長郭彥良進一步說明,資料飛輪機制的運作架構。首先在資料收集階段,必須系統性蒐集公開資料、內部檔案與報告,並透過 AI 協作將圖片等非結構化資訊轉換為可用的結構化數據。接著進入資料精煉,透過資料清洗與實體對齊,將原始資訊從單純的可閱讀升級為可比較、可推論的決策依據。第三步專家把關,則引入不動產專家進行校正與產業判讀,補上模型難以理解的規則與慣例,確保關鍵數據的正確性。最後的決策反饋階段,藉由收集使用者提問與行為,檢視現有資料是否足夠精準,再回到專家校正與補齊流程,使整個系統能隨使用頻率提升而持續進化。

在資料飛輪的運作基礎上,方睿科技正積極研發商用地產智慧平台 PickPeak。郭彥良表示,PickPeak 並非單純的物件搜尋工具,而是結合深度資料與 AI 的決策輔助平台。使用者可透過自然語言互動,提出人數、預算、區位、產業屬性等多重條件,再由系統動態生成可比較、可驗證的選址方案,真正將 AI 從「回答問題的工具」,轉化為「陪伴決策的數位專家」。

方睿科技
方睿科技技術長 郭彥良
圖/ 數位時代

創新 Data to win 模式,讓 AI 深入商用地產各階段決策流程

不過,單靠數據整合與 AI 應用仍不足以支撐產業全面升級,因此,方睿科技提出的第二條路就是,推動產業生態系聯盟,整合商用地產市場上不同角色的數據,讓 AI 能夠真正成為商用地產決策時的智慧引擎。

方睿科技不動產知識創新中心總監曾凡綱指出,目前在企業、房東或物業主與各類服務供應商之間,缺乏有效的整合機制,導致企業在選址與空間規劃過程中,難以快速找到真正合適的服務與解決方案,形成明顯的產業斷點。

為解決這些斷點,方睿科技提出「Data to win」模式,以資料取代傳統「Pay to win(付費買廣告)」思維,讓真正具備經驗與實績的服務夥伴,在適當的決策節點被看見。

曾凡綱說明,在廣告投放效益越來越低的情況下,企業服務商面臨的問題已不只是「如何曝光」,而是「如何在對的地方被看見」,這將是未來的市場勝出指標;而 Data to win 正好可以協助企業服務商建立此能力,方睿科技將生態系夥伴所擁有的案例、服務紀錄與產業知識等資料,經過去識別化與結構化處理後,再嵌入企業決策流程中,讓推薦不再來自廣告投放,而是真實、可被驗證的使用經驗,透過這樣的機制,不僅提升企業決策的準確度,也能同步放大生態系夥伴在合作中的實質價值。

舉例來說,方睿科技整合辦公傢俱夥伴 Backbone 班朋實業長期累積的辦公室規劃案例與平面圖資料,讓企業在選址階段,就能同步評估空間規劃方案,加速決策流程。又如,整合出行服務夥伴 USPACE 悠勢科技的服務資料,並呈現在地圖上,協助企業評估辦公據點的交通便利性,優化員工日常通勤與出行體驗。此外,平台也可整合大樓的 ESG 認證、公共設施與服務層資訊,協助企業快速篩選符合需求的辦公大樓,提升進駐媒合效率。

方睿科技
方睿科技不動產知識創新中心總監 曾凡綱
圖/ 數位時代

「Raise Day 只是這場變革的起點。」吳健宇強調,方睿科技已經透過投資與合夥模式,將布局延伸至專業地產服務與空間經營領域,至今旗下已有商用不動產仲介、顧問與估價等專業服務的宇豐睿星,以及聚焦商用地產代銷市場的希睿創新置業。透過直接參與第一線實務運作,方睿得以更深入理解產業真實痛點,讓科技不只是工具,而能真正回應實際決策與服務需求。

此外,方睿科技未來也將持續擴大「商用地產 x 企業服務生態系」聯盟,目前包括 Backbone、USPACE、IKEA For Business、潔客幫等企業服務夥伴已率先加入;接下來,方睿科技將邀請更多擁有關鍵數據與專業能力的企業服務商加入,讓數據在安全、可控的前提下流動,進一步釋放商用地產在選址、營運與企業服務等全生命週期中的結構性價值,為產業轉型啟動下一個關鍵階段。

方睿科技
右起方睿科技共同創辦人暨營運長陳致瑋、USPACE悠勢科技共同創辦人暨執行長宋捷仁 、Backbone班朋實業創辦人暨執行長廖家葳,透過企業服務生態系合作共同為產業啟動下一個關鍵階段。
圖/ 數位時代

方睿科技官網: https://www.funraise.com.tw

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
2026 大重啟
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓