外媒實測8款AI搜尋工具,高達60%都在糊弄你!最常犯的是這三大錯誤
外媒實測8款AI搜尋工具,高達60%都在糊弄你!最常犯的是這三大錯誤

重點一: AI搜尋工具普遍表現不佳,錯誤回答率高達60%以上。

重點二: 不要以為付費AI模型就很安全,研究發現,這些高級模型提供的錯誤答案比免費版更有信心且更多。

重點三: AI搜尋工具常無視發布商的機器人排除協議,未正確引用原始內容。

研究發現,AI搜尋工具正迅速增加受歡迎程度,但效能卻令人擔憂。根據陶氏數位新聞研究中心(Tow Center for Digital Journalism)最新研究顯示,市面上常見的8款主流AI聊天機器人在資訊檢索測試中,超過60%的回答完全錯誤,其中馬斯克(Elon Musk)的Grok 3更創下錯誤率高達94%的驚人紀錄。這些工具正從網際網路爬取和重新包裝內容,但呈現方式卻常常掩蓋了嚴重的資訊品質問題。

AI搜尋錯誤率高得嚇人

陶氏數位新聞研究中心是由哥倫比亞大學新聞學研究所成立,該中心的測試結果顯示,目前最受歡迎的生成式AI搜尋工具表現不佳,整體而言超過6成的問題答案完全錯誤。測試涵蓋8主流AI搜尋工具,包括ChatGPT搜尋、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search和Copilot。

在所有測試工具中,Perplexity表現最佳,但仍有37%的回答不正確;而表現最差的Grok 3則有高達94%的回答錯誤。更令人擔憂的是,這些AI工具在提供錯誤答案時往往表現出極高的信心,很少使用如「可能」、「似乎」等詞,也極少承認知識不足。ChatGPT在200個回應中,僅15次表示缺乏信心,且從未拒絕提供答案。

AI工具錯誤率.jpg
圖/ 陶氏數位新聞研究中心

研究方法

該研究團隊從20家新聞機構隨機選取了200篇文章(每家10篇),確保每篇文章摘錄的內容在傳統Google搜尋中,都能在前三個結果中找到原始來源。然後,研究人員向每個AI搜尋工具提供這些摘錄,要求識別對應文章的標題、原始發布來源、發布日期和網址。
研究人員根據三項屬性:(1)正確文章、(2)正確發布來源和(3)正確網址,手動評估了聊天機器人的回應。按照這些參數,每個回應被標記為以下標籤之一:完全正確、正確但不完整、部分不正確、完全不正確、未提供或爬蟲被阻止。

AI搜尋常犯的幾項錯誤

根據該研究,AI搜尋工具在實際使用中展現出多項嚴重問題,包括:

未能正確連結原始來源: AI聊天機器人經常錯誤引用文章。例如,DeepSeek在200次查詢中有115次錯誤歸因摘錄來源。即使聊天機器人正確識別了文章,也常未能正確連結到原始來源,而是引導到Yahoo News或AOL等平台上的轉載版本。

付費模型「更有自信」胡說八道: 令人驚訝的是,付費版本如Perplexity Pro(每月20美元,約新台幣639元)或Grok 3(每月40美元,約新台幣1,278元)雖然比免費版答對了更多問題,但它們整體錯誤率反而更高,主要是因為它們傾向於提供明確但錯誤的答案,而非拒絕直接回答。

虛構或損壞的網址: 超過一半來自Gemini和Grok 3的回應引用了虛構或損壞的網址,導致錯誤頁面。Grok 3在200個提示中有154個引用導致錯誤頁面,即使在正確識別文章時,它也經常連結到虛構的網址。

8款聊天機器人搜尋正確度評比

如下表,Perplexity Pro ($20/月) 表現還算不錯,錯誤率約40%;然而 Grok 3 ($40/月) 的錯誤率高達94%,是所有測試中最高的。

聊天機器人 錯誤率 是否為高級模型 是否公開其爬蟲程序的名稱 引用錯誤來源的次數
Perplexity 約37% 57 (錯誤文章) + 27 (404錯誤連結) = 84
Perplexity Pro 約40% 是 ($20/月) 72 (錯誤文章)
Grok 2 約53% 62 (錯誤文章) + 10 (404錯誤連結) = 72
DeepSeek 約57% 115 (錯誤文章)
Copilot 約60% 72 (錯誤文章)
ChatGPT 約61% 79 (錯誤文章) + 42 (缺失連結) = 121
Gemini 約76% 127 (404錯誤連結) + 22 (錯誤文章) = 149
Grok 3 94% 是 ($40/月) 117 (404錯誤連結) + 26 (錯誤文章) = 143
付費模型.jpg
圖/ 陶氏數位新聞研究中心

研究中也發現,多數機器人無視發布者的爬蟲限制,即使被封鎖仍獲取內容。例如,Perplexity Pro正確識別了近三分之一本應無權訪問的90個摘錄。

而就算有合作關係,AI也未必能100%準確識別其內容,像是《舊金山紀事報》(San Francisco Chronicle)允許OpenAI的爬蟲,但ChatGPT只正確識別了10個分享摘錄中的1個。

必須說明的是,「機器人排除協議」雖不具有法律約束力,但它是一種被廣泛接受的標準,用於指示網站哪些部分應該被抓取,哪些部分不應該被抓取。

延伸閱讀:不怕AI搶工作!7大類職業成「鐵飯碗」:工程、護理、資安⋯月薪上看10萬元

AI巨頭們怎麼說?

對於報告結果,研究中心指出,「我們聯繫了本報告中提到的所有人工智慧公司徵求意見,只有 OpenAI和微軟做出了回應,但都沒有回答我們的具體發現或問題。」

OpenAI指出:「我們透過幫助每週4億ChatGPT用戶透過摘要、引用、清晰連結和歸因發現優質內容來支持出版商和創作者。我們與合作夥伴合作,以提高內聯引用的準確性並尊重出版商的偏好,包括透過管理robAI.txt中的OrobAI-Search來增強它們在搜尋結果。」

微軟則表示:「微軟尊重robots.txt標準,並尊重那些不希望其網頁內容被該公司的生成式 AI 模型使用的網站提供的指示。」

延伸閱讀:
Google Gemini推出免費照片編輯功能!Image Editing怎麼用?4步驟教學一次懂

AI工具懶人包|幫你搞定搜尋、寫作、簡報與資料整理:12款生產力工具一次收

資料來源:Tow Center for Digital JournalismTECHSPOTmashable

本文初稿為AI編撰,整理.編輯/林美欣

關鍵字: #AI工具
往下滑看下一篇文章
博弘雲端打造金融業專屬 AI 解決方案 賦能金融產業實現智慧轉型!
博弘雲端打造金融業專屬 AI 解決方案 賦能金融產業實現智慧轉型!

從流程再造、智能客服到科技防詐,AI 正在一步步改變台灣金融業的樣貌。根據金管會「金融業者及周邊單位應用人工智慧」調查結果,金融業者導入AI與生成式AI的比例已從29%提升至33%,顯示金融業對AI應用的需求正持續升溫,而AWS亞太(台北)區域的正式啟用,更將加速這股成長力道,讓AI躍升為金融創新的核心引擎,推動整個產業快速邁向新局。

在這股潮流下,博弘雲端作為台灣第一家與AWS簽署台北區域戰略合作協議(New Region Strategic Collaboration Agreement,SCA)的雲端解決方案專家,如何協助金融業快速導入創新AI應用,讓「智慧金融」能夠真正落地在各個金融場景中?

對此,博弘雲端台灣暨東南亞事業中心副總經理陳亭竹給出的答案很明確:關鍵在於從痛點出發,讓金融業能夠以更低的門檻達成數據上雲與導入AI應用的目標。

標準化 × 客製化,雙管齊下加速金融AI真正落地

陳亭竹進一步指出,金融業在推動雲端與AI應用時,普遍面臨合法合規、AI倫理風險、人才不足與組織變革等四大挑戰。對此,博弘雲端提供產業客製化AI解決方案,滿足金融業在AI與數據應用上的多元需求,進而加速AI應用落地。

「要讓AI應用在金融業真正落地,雲服務業者的客製化能力是關鍵。」博弘雲端台灣暨東南亞事業中心技術處長孫正忠強調,因為每家金融業對上雲和AI應用的需求並不相同,甚至對AI 技術的要求與精準度都有不同期待。而標準化產品雖能快速導入,卻難以完全貼合每位客戶的營運場景與精細需求,唯有結合客製化服務,才能真正滿足金融業在AI與數據應用上的高標準,並符合大型金融客戶的嚴格驗收要求。

因此,博弘雲端推出產業客製化AI解決方案,建構在標準化解決方案的架構之上,進一步依照客戶需求進行微調。不僅能讓 AI 回答更加精確,也能更貼近終端客戶的實際需求,無論是篩選資料、優化決策,甚至提供行銷策略建議,都能展現更高的效益。

除了透過客製化服務滿足金融業者AI與數據應用上的多元需求,博弘雲端亦推出標準化產品驅動金融產業AI革新。從”AICOM”提供的新世代雲智能管理功能,賦能金融IT部門一站式管理雲端資源、即時掌握AI訓練資源運用狀態;到”LEMMA”提供的 AI企業知識代理,藉由LLM (大型語言模型) 摘要與整理重點、大幅減少人工查詢資料的時間,這些產品不僅加乘金融業者採用AI的效益,更成為推動產業升級的關鍵方程式。

RD099049.jpg
博弘雲端台灣暨東南亞事業中心副總經理 / 陳亭竹表示:要讓AI應用在金融業真正落地,雲服務業者的客製化能力是關鍵。唯有結合客製化服務,才能真正滿足金融業在AI與數據應用上的高標準,並符合大型金融客戶的嚴格驗收要求。
圖/ 數位時代 拍攝

售前 × 數據雙團隊,一站式滿足數據處理和AI應用需求

金融產業的AI應用百百種,博弘雲端不只提供產業客製化解決方案,更透過技術團隊的深度參與來強化客製化程度。首先是售前技術團隊,該團隊整合公司多年服務大型客戶的經驗與專業人才,能在專案初期便與客戶進行需求訪談與技術交流,並據此繪製完整的系統架構圖,確保AI應用精準契合需求,大幅提升專案成功落地的機率。

其次是數據團隊,涵蓋數據工程師、數據分析師與數據科學家三種不同職能,能與售前技術團隊的需求分析與架構設計緊密銜接,一站式滿足金融業從數據處理到應用的完整需求。

博弘雲端台灣AWS事業處業務資深處長郭仁傑進一步說明二個團隊的具體運作模式。售前技術團隊在完成需求分析與架構圖後,數據工程師會協助金融業將地端資料搬遷到雲端資料倉儲,並確保數據的正規化與可用性;接著由數據分析師統整數據並建立戰情室、商業智慧分析等應用,幫助客戶快速掌握營運數據;最後由數據科學家根據實際應用情境選擇或開發適合的AI模型,實現提升營運效率或優化客戶體驗的目標。「經過概念驗證與專案的執行,金融業普遍能提升5倍以上的資料處理效率,運用AI提升10~50%不等的生產力」,郭仁傑強調。

RD099024.jpg
「要讓AI應用在金融業真正落地,雲服務業者的客製化能力是關鍵。」博弘雲端台灣暨東南亞事業中心技術處長 / 孫正忠強調
圖/ 數位時代 拍攝

攜手 AWS 與生態系戰略夥伴,全面備戰金融業轉型需求

除了內部團隊的緊密協作,博弘雲端也積極深化與AWS和第三方夥伴的合作關係,加強解決方案的廣度與深度,確保能更全面回應金融業多樣化的需求。

「客戶至上一直是博弘雲端的企業文化,」陳亭竹表示,博弘雲端很早之前就洞察到金融業數位轉型的商機,加上AWS當時正如火如荼推進亞太(台北)區域的落地,因而與其展開台北區域戰略合作協議的討論,並於2025年7月正式簽訂,成為台灣第一家簽署該協議的AWS核心級諮詢夥伴。

「這是一份區域級的合作協議,必須要有足夠紮實的市場經驗和具代表性的客戶導入案例,才能獲得AWS的認可與信任,」陳亭竹強調,這份協議不僅代表AWS對博弘雲端實力的高度肯定,更意味著博弘雲端可以進一步放大服務能量,串聯更多生態圈夥伴,全面支援金融業的數位轉型。

由於金融業在上雲時,對資安防禦、效能監測、數據管理等面向,可能都有不同需求,博弘雲端自成立以來,便持續與不同領域的夥伴攜手合作,包括Palo Alto Networks、Databricks及MongoDB等國際級解決方案廠商,滿足金融業在上雲時的特殊需求。而隨著與AWS簽訂台北區域戰略合作協議,博弘雲端得以進一步擴大合作生態圈,為金融業打造更完整的雲端與AI解決方案,全力加速其上雲與創新進程。

專業技術建立信任,博弘雲端成金融業轉型首選夥伴

憑藉卓越的客製化服務能力、與AWS的緊密合作關係及多元的生態圈夥伴,讓博弘雲端在金融領域展現亮眼成果,不只在技術面持續採用創新科技賦能金融業成功轉型,更透過技術專業力獲得客戶高度信賴,某大型金融業客戶在數據上雲專案結束後,主動表示希望繼續合作。

郭仁傑說明,博弘雲端自3年前開始,即協助該客戶將地端數據逐步上雲,並導入Data Hub建立完善的資料治理(Data Governance)機制。隨著數據上雲後的效益逐步展現,不僅吸引同集團內其他子公司與海外據點相繼啟動數據上雲計劃,更將合作期間展延至7年,藉助博弘雲端的技術與服務能量,持續深化雲端與AI應用,推動整個集團的數位創新藍圖。

1757919697308.jpg
郭仁傑說明,博弘雲端自3年前開始,即協助該客戶將地端數據逐步上雲,並導入Data Hub建立完善的資料治理(Data Governance)機制。
圖/ 數位時代 拍攝

目前除了金融業之外,博弘雲端在製造、零售和公部門也累積了豐富的雲端技術導入經驗。展望未來,博弘雲端除了持續與AWS維持緊密合作、不斷精進雲端技術能力外,更將全面強化在資安託管服務 (Managed Security Services Provider, MSSP) 與技術生態圈的戰略布局,並積極拓展東南亞市場,成為台灣雲端服務業進軍國際的領航者。不僅向海外輸出台灣的成功經驗,更將成為驅動東南亞地區數位轉型的關鍵力量。

更多金融業上雲案例:立即與博弘雲端專業團隊討論

https://www.nextlink.cloud/contact/

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
一次搞懂Vibe Coding
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓