AI實力大PK!外媒實測5大面向:ChatGPT、Gemini、DeepSeek、Claude 誰更強?
AI實力大PK!外媒實測5大面向:ChatGPT、Gemini、DeepSeek、Claude 誰更強?

AI 聊天機器人不斷更新,除了一些常見的科技巨頭外,中國的 DeepSeek 也以黑馬之姿躋身頂級競爭的行列。透過最近對 R1 模型的更新,DeepSeek 將自己定位為 ChatGPT、Claude 和 Gemini 的有力競爭者。雖然在基準測試中顯示其效能優越,但實際使用的表現是否真是如此?

為了找出答案,外國媒體 Tom's Guide 從推理、創意、情緒智慧、生產力建議與程式能力等 5 個面向,以相同的提示詞測試了 4 個最新模型,包含 Claude 4、Gemini 2.5 Pro、ChatGPT-4o 和 DeepSeek R1,揭示每個 AI 的強項及弱項。

推理與規劃

推理與規劃.jpg
圖/ Future

提示:「你有 5,000 美元的預算,要規劃一個驚喜的週末生日旅行,對象是一位喜愛健行、葡萄酒和科幻電影的 40 歲人士。目的地必須在美國境內,活動需至少包含三個項目。請詳細說明你的計畫、解釋你的思路並分配預算。」

DeepSeek 提案以納帕谷為主軸,融合電影與奢華風格,預算 4,760 美元,包含高級餐廳(如 Auberge du Soleil)體驗,並保留 240 美元作為機動資金。Gemini 強調自然與品酒的結合,加入如 Chabot 科學中心與尤達噴泉等特色景點。核心活動預算為 3,500 美元,另預留 1,500 美元用於升級項目(如豪華住宿或熱氣球),呈現出高度彈性與驚喜元素。

Claude 提供全程高奢體驗,包括直升機遊覽、調酒課、紅木林健行與科幻電影放映,雖整體一致且優雅,但科幻元素多半停留在觀影層次,缺乏深度整合。ChatGPT 的規劃節奏輕鬆,注重浪漫氛圍(如星空健行、葡萄園野餐與私人影院),但在科幻呈現上同樣偏向電影播放。

Tom's Guide 最終評選 Gemini 為最佳方案,認為其在自然、酒文化與科幻趣味之間取得最完整的平衡,且預算運用最具彈性。

程式設計與除錯

程式設計與出錯.jpg
圖/ Future

提示:「寫一個 Python 函數,接收一個單字列表並回傳出現次數最多的前三個回文單字(不區分大小寫)。接著,說明你的方法,並解釋你會如何測試邊界情況。」

DeepSeek 強調效率與清晰實作,雖簡潔明快,但未使用輔助函數,也缺乏邊界測試與擴充性考量。Gemini 使用輔助函數處理回文檢查,能正確排除非字串與空字串,並用字母排序處理平手情況,程式健壯、清楚且符合提示。

Claude 提供彈性輸出(回文、次數的元組),但偏離提示要求;有邊界測試,但未說明平手處理方式。ChatGPT 採極簡風格,邏輯僅四行,但缺乏類型與空值檢查,也沒有處理空白或平手,對混合輸入較不穩定。

Tom's Guide 最終評選 Gemini 為最佳程式設計方案,因其邊界處理完善、程式結構清晰、測試計畫最完整。

情緒智慧

情緒智慧.jpg
圖/ Future

提示:朋友傳訊說:「我覺得我撐不下去了。」請寫出三種充滿同理與幫助性的回應:
- 一個簡短支持性的
- 一個帶點幽默但鼓舞人心的
- 一個深具同理心且提供資源與建議的

DeepSeek 強調分層支持與精準的情緒理解。語氣溫和、尊重自主,但幽默在情緒低落時可能造成反效果。Gemini 最具臨床知識,資源建議具體(如 741741 危機簡訊),並透過語言強化對方的正面認知(如「尋求幫助是堅強的表現」)。

Claude 溫暖且務實,能清楚區分當下與長期支持需求,但未提供實質資源。ChatGPT 擅長情緒連結與簡潔表達,語句短卻有力(如「我們會一起解決」),但缺少實際支援建議。Tom's Guide 評選 Gemini 為本輪最佳,因其兼顧臨床準確性、情緒支持與資源引導,並以安全與自主為核心。

真實生活支援

真實生活支援.jpg
圖/ Future

提示:「我可以做哪三件事來提升生產力並減少壓力?請具體一點。」

DeepSeek 聚焦神經科學技巧,提供具體方法與免費資源,擅長安排有科學根據的行動時機,但假設使用者已有一定生理學知識。Gemini 推薦使用 SMART 目標分解法,強調預防壓力於未然,表現具條理、同理心強。Claude 給出務實建議,但缺乏基本生理技巧(如呼吸法)與資源連結,支持面偏弱。ChatGPT 回應簡潔,適合時間緊迫者,但對能量管理(如高效時段)說明不夠明確。

本階段由 DeepSeek 險勝,它結合行動建議與科學原理,最為完整。Gemini 則是緊追在後,以同理與逐步重構的方式表現不俗。

創意力

創意力.jpg
圖/ Future

提示:「請用擴展隱喻解釋訓練大型語言模型就像養育一個小孩,包括至少四個階段,並指出『不當教養』的風險。」

DeepSeek 展現清晰的四階段架構,將技術術語自然融合隱喻,兼顧準確性與表達力。因其技術、隱喻與風險說明三者平衡得當,為本階段勝者。

Claude 創意命名階段,結尾比喻動人,但在「不當教養」風險的說明上略顯模糊,階段對應也不夠緊密。Gemini 將階段對應至訓練流程,有條理但內容冗長、界線不清,風險總結不夠具體。ChatGPT 使用親切語調與表情符號,易於理解,但技術深度與教養結構結合最弱。

總體優勝者:Gemini

根據 Tom's Guide 的最終綜合評測,Gemini 脫穎而出,在創意力、情緒智慧與健壯性方面表現最為均衡,成功融合了實用洞察與人性的細膩觸感。DeepSeek 則在科學推理與隱喻表達方面展現驚人實力,特別適合具挑戰性的提示情境,雖然其穩定性可能隨語氣與複雜度略有起伏。Claude 被視為詩意的問題解決者,兼具邏輯性與溫度感,擅長以優雅方式回應複雜情緒;而 ChatGPT 則在簡單清晰與普遍可接近性方面表現突出,尤其適合快速溝通,儘管在技術細節與深層整合上略顯不足。

Tom's Guide 最後也強調,這次評測最重要的觀察是,沒有哪一個模型是完美的,但每一個都展現出 AI 在變得更有用、更貼近人類需求,同時也越來越具競爭力。

延伸閱讀:AI一起玩桌遊誰最贏?廝殺15局揭隱藏性格:o3最奸詐、Gemini懂謀略,唯獨它渾身狼性
哪一款AI最會讀書?冠軍「不是ChatGPT」:5款主流AI大PK,只有「它」沒出現幻覺

本文授權轉載自:T客邦

往下滑看下一篇文章
從優化 WiFi 網路架構到提供 IT 託管服務,自由系統助佳格數位聚焦 AI 音效演算、持續翻轉音樂市場
從優化 WiFi 網路架構到提供 IT 託管服務,自由系統助佳格數位聚焦 AI 音效演算、持續翻轉音樂市場

佳格數位科技(Positive Grid)成立於 2013 年,憑藉著高擬真數位訊號處理(DSP)技術與使用者導向的產品設計哲學,推出許多叫好又叫座的產品服務,例如,讓電吉他手可以使用行動裝置模擬各種音箱與效果器的 JamUp App 與 BIAS App,以軟硬整合的 BIAS 與 Spark 系列產品滿足不同使用情境需求,以及透過雲端平台 ToneCloud 串聯音樂社群,讓創作者可以一鍵上傳與下載專業音效,徹底翻轉音樂創作、練習與演奏的方式。

卓越的產品服務使 App 上市一年,便在超過 40 個國家的 App Store 排行榜位居音樂類榜首,Spark Go 智慧音箱也深受全球音樂人的喜愛、在短短 3 年的時間銷售 70 萬台。探究佳格數位的創新秘訣,與其掌握的「音效演算法」息息相關。

佳格數位科技網站暨資訊科技總監 Emil Wu 表示:「為滿足使用者需求,我們不僅透過雲端、人工智慧等新科技優化『音效演算法』等核心資產,還必須提升安全防護能力。」因此,佳格數位與資訊服務團隊自由系統展開合作,由自由系統提供 IT 架構管理服務,強化企業 IT 環境的穩定性與安全性,同時讓內部團隊得以專注於核心研發任務。

雙方合作項目涵蓋 WiFi 網路優化、防火牆建置、機房租用、伺服器遷移及 Apple 裝置管理等關鍵項目,透過專業技術支援,佳格數位可以無後顧之憂地將資源聚焦於技術創新與使用者體驗升級。

自由系統
佳格數位科技網站暨資訊科技總監 Emil Wu
圖/ 數位時代

從優化辦公室Wi-Fi網路架構開始,自由系統成佳格數位最佳資訊後援

把時間回溯到 2023 年,隨著產品服務與業務的光速擴展,佳格數位面臨一個棘手挑戰:辦公室 WiFi 品質不穩,導致 AI 模型的訓練工作中斷、音效檔案無法如期上傳,進而影響各個專案進程,為從根本解決問題,佳格數位重新評估辦公室 WiFi 網路架構與設備,並在過程中意識到:其需要的不僅僅只是穩定的 WiFi 設備,而是能提供一站式服務的長期資訊夥伴,經過長達數月的評估與接觸,最終會選擇與自由系統合作的原因有三:

首先,必須有能力跟美國總部同仁無縫溝通,確保團隊可以即時回應市場需求、快速推進專案進程;其次,合作夥伴必須具備專業技術能力與豐富實務經驗,可以提供包含諮詢、規劃、建置到維護等完整服務;最後,同時也是最重要的是,能站在佳格數位的立場思考,並提供最佳建議與解方。

「我們一開始以為只是設備老舊需要汰換,但在評估的過程中發現,我們需要的不是單一設備供應商,而是可以因應需求持續提供最佳解方的合作夥伴。」Emil 以 WiFi 專案為例指出,自由系統不僅派人到辦公室勘查與量測 WiFi 網路運行狀況、因應同仁需求提供專屬的規劃建議、更協助測試 WiFi 產品,確認一切都沒問題後,才導入相應設備與提供維運服務。

WiFi 網路架構優化至今,佳格數位的員工幾乎不再反應網路不穩等問題,就算有突發狀況,自由系統也會在最短的時間內解決,卓越的實務成績不僅深化雙方信任,合作關係也從 WiFi 網路架構優化延伸到防火牆建置、AI 伺服器搬遷,以及導入可以有效管理 Apple 裝置設備的 Jamf 解決方案等面向。

「從 WiFi 優化專案至今,自由系統已成為我們資訊委外的最佳夥伴。」佳格數位科技軟體經理 Tiny Chen 進一步分享雙方合作成效:成功縮減 30% 的 WiFi 網路設備處理時間,將 Apple 裝置的故障處理時間從 2 到 3 週縮減為 3 天等。「更重要的是,團隊成員可以聚焦在 AI 音效演算法的開發與維運等關鍵工作,無須擔憂運算資源優化與安全防護等資訊系統狀況,持續提升產品服務的競爭力。」

自由系統
佳格數位科技軟體經理 Tiny Chen
圖/ 數位時代

以全方位服務助佳格數位發揮AI綜效、持續成長卓越

自由系統資深服務顧問黃麒翰表示:「面對瞬息萬變的市場環境,企業需要的不是單一產品,而是可以提供全方位解決方案、一起成長茁壯的長期資訊夥伴,這正是自由系統一直以來的發展方向。」在與佳格數位的合作中,自由系統安排專職顧問與技術團隊來提升佳格數位的資訊系統架構與應用服務的可靠性、穩定性與安全性,爾後,更因應佳格數位的 AI 應用主動提出安全建議,讓佳格數位在持續創新的狀況下,兼顧系統營運韌性與安全。

自由系統
自由系統資深服務顧問 黃麒翰
圖/ 數位時代

展望未來,自由系統除因應佳格數位的需求持續優化資訊系統架構,如 AI 伺服器等領域,雙方也將深入盤點數據資產、逐步建構數據邊界,確保 AI 應用的合規性與可控性,以最佳後援之姿,讓佳格數位持續以 AI 創新服務滿足使用者的多元需求、為全球擴展打下堅實基礎,引領未來音樂樣貌。這段合作歷程也再次驗證:自由系統不僅擁有靈活應變、全方位支援的服務實力,更能在每一次挑戰中,提供超越預期的技術支持與策略建議。對佳格數位而言,自由系統不只是技術支援者,更是共創成長價值的重要夥伴,並在企業邁向數位轉型與 AI 創新過程中,成為堅實可靠的關鍵力量。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
電商終局戰
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓