外媒實測8款AI搜尋工具,高達60%都在糊弄你!最常犯的是這三大錯誤
外媒實測8款AI搜尋工具,高達60%都在糊弄你!最常犯的是這三大錯誤

重點一: AI搜尋工具普遍表現不佳,錯誤回答率高達60%以上。

重點二: 不要以為付費AI模型就很安全,研究發現,這些高級模型提供的錯誤答案比免費版更有信心且更多。

重點三: AI搜尋工具常無視發布商的機器人排除協議,未正確引用原始內容。

研究發現,AI搜尋工具正迅速增加受歡迎程度,但效能卻令人擔憂。根據陶氏數位新聞研究中心(Tow Center for Digital Journalism)最新研究顯示,市面上常見的8款主流AI聊天機器人在資訊檢索測試中,超過60%的回答完全錯誤,其中馬斯克(Elon Musk)的Grok 3更創下錯誤率高達94%的驚人紀錄。這些工具正從網際網路爬取和重新包裝內容,但呈現方式卻常常掩蓋了嚴重的資訊品質問題。

AI搜尋錯誤率高得嚇人

陶氏數位新聞研究中心是由哥倫比亞大學新聞學研究所成立,該中心的測試結果顯示,目前最受歡迎的生成式AI搜尋工具表現不佳,整體而言超過6成的問題答案完全錯誤。測試涵蓋8主流AI搜尋工具,包括ChatGPT搜尋、Perplexity、Perplexity Pro、Gemini、DeepSeek Search、Grok-2 Search、Grok-3 Search和Copilot。

在所有測試工具中,Perplexity表現最佳,但仍有37%的回答不正確;而表現最差的Grok 3則有高達94%的回答錯誤。更令人擔憂的是,這些AI工具在提供錯誤答案時往往表現出極高的信心,很少使用如「可能」、「似乎」等詞,也極少承認知識不足。ChatGPT在200個回應中,僅15次表示缺乏信心,且從未拒絕提供答案。

AI工具錯誤率.jpg
圖/ 陶氏數位新聞研究中心

研究方法

該研究團隊從20家新聞機構隨機選取了200篇文章(每家10篇),確保每篇文章摘錄的內容在傳統Google搜尋中,都能在前三個結果中找到原始來源。然後,研究人員向每個AI搜尋工具提供這些摘錄,要求識別對應文章的標題、原始發布來源、發布日期和網址。
研究人員根據三項屬性:(1)正確文章、(2)正確發布來源和(3)正確網址,手動評估了聊天機器人的回應。按照這些參數,每個回應被標記為以下標籤之一:完全正確、正確但不完整、部分不正確、完全不正確、未提供或爬蟲被阻止。

AI搜尋常犯的幾項錯誤

根據該研究,AI搜尋工具在實際使用中展現出多項嚴重問題,包括:

未能正確連結原始來源: AI聊天機器人經常錯誤引用文章。例如,DeepSeek在200次查詢中有115次錯誤歸因摘錄來源。即使聊天機器人正確識別了文章,也常未能正確連結到原始來源,而是引導到Yahoo News或AOL等平台上的轉載版本。

付費模型「更有自信」胡說八道: 令人驚訝的是,付費版本如Perplexity Pro(每月20美元,約新台幣639元)或Grok 3(每月40美元,約新台幣1,278元)雖然比免費版答對了更多問題,但它們整體錯誤率反而更高,主要是因為它們傾向於提供明確但錯誤的答案,而非拒絕直接回答。

虛構或損壞的網址: 超過一半來自Gemini和Grok 3的回應引用了虛構或損壞的網址,導致錯誤頁面。Grok 3在200個提示中有154個引用導致錯誤頁面,即使在正確識別文章時,它也經常連結到虛構的網址。

8款聊天機器人搜尋正確度評比

如下表,Perplexity Pro ($20/月) 表現還算不錯,錯誤率約40%;然而 Grok 3 ($40/月) 的錯誤率高達94%,是所有測試中最高的。

聊天機器人 錯誤率 是否為高級模型 是否公開其爬蟲程序的名稱 引用錯誤來源的次數
Perplexity 約37% 57 (錯誤文章) + 27 (404錯誤連結) = 84
Perplexity Pro 約40% 是 ($20/月) 72 (錯誤文章)
Grok 2 約53% 62 (錯誤文章) + 10 (404錯誤連結) = 72
DeepSeek 約57% 115 (錯誤文章)
Copilot 約60% 72 (錯誤文章)
ChatGPT 約61% 79 (錯誤文章) + 42 (缺失連結) = 121
Gemini 約76% 127 (404錯誤連結) + 22 (錯誤文章) = 149
Grok 3 94% 是 ($40/月) 117 (404錯誤連結) + 26 (錯誤文章) = 143
付費模型.jpg
圖/ 陶氏數位新聞研究中心

研究中也發現,多數機器人無視發布者的爬蟲限制,即使被封鎖仍獲取內容。例如,Perplexity Pro正確識別了近三分之一本應無權訪問的90個摘錄。

而就算有合作關係,AI也未必能100%準確識別其內容,像是《舊金山紀事報》(San Francisco Chronicle)允許OpenAI的爬蟲,但ChatGPT只正確識別了10個分享摘錄中的1個。

必須說明的是,「機器人排除協議」雖不具有法律約束力,但它是一種被廣泛接受的標準,用於指示網站哪些部分應該被抓取,哪些部分不應該被抓取。

延伸閱讀:不怕AI搶工作!7大類職業成「鐵飯碗」:工程、護理、資安⋯月薪上看10萬元

AI巨頭們怎麼說?

對於報告結果,研究中心指出,「我們聯繫了本報告中提到的所有人工智慧公司徵求意見,只有 OpenAI和微軟做出了回應,但都沒有回答我們的具體發現或問題。」

OpenAI指出:「我們透過幫助每週4億ChatGPT用戶透過摘要、引用、清晰連結和歸因發現優質內容來支持出版商和創作者。我們與合作夥伴合作,以提高內聯引用的準確性並尊重出版商的偏好,包括透過管理robAI.txt中的OrobAI-Search來增強它們在搜尋結果。」

微軟則表示:「微軟尊重robots.txt標準,並尊重那些不希望其網頁內容被該公司的生成式 AI 模型使用的網站提供的指示。」

延伸閱讀:
Google Gemini推出免費照片編輯功能!Image Editing怎麼用?4步驟教學一次懂

AI工具懶人包|幫你搞定搜尋、寫作、簡報與資料整理:12款生產力工具一次收

資料來源:Tow Center for Digital JournalismTECHSPOTmashable

本文初稿為AI編撰,整理.編輯/林美欣

關鍵字: #AI工具
往下滑看下一篇文章
把技術變成實際訂單!中華電信 5G加速器攜手新創 推動 AI 與數位韌性應用落地
把技術變成實際訂單!中華電信 5G加速器攜手新創 推動 AI 與數位韌性應用落地

不少新創團隊普遍面臨技術成熟,但難以找到實際應用場域或跨越市場導入門檻的機會,使創新停留在概念驗證階段。對新創而言,能否進入適合的產業平台並對接市場需求,往往是推動成長的關鍵。

為了成為新創最強後盾,中華電信日前啟動「2026第八屆 5G 加速器」徵選活動。此次除了提供技術資源、場域驗證與企業媒合機會,更設置 「AI 創新特別獎」與「海地星空特別獎」,希望結合自身龐大的 5G 生態圈與產業資源,協助潛力新創把創新技術真正推進市場,加速走向商業落地。

中華電信舉辦「2026數位創新應用系列賽」宣告記者會,中華電信簡志誠董事長致詞
中華電信舉辦「2026數位創新應用系列賽」宣告記者會,中華電信簡志誠董事長致詞
圖/ 中華電信5G加速器

中華電信5G加速器:不只給資源,更幫新創找到市場

自 2018 年成立至今,中華電信 5G 加速器已累積輔導超過 80 家新創團隊,合作領域也從早期的 5G 應用,逐步延伸至 AI、資通安全、量子運算、數位娛樂、運動科技、創新永續、通訊基礎建設等不同面向。在這過程中,中華電信 5G 加速器逐步摸索出與其他企業加速器不同的定位:不只提供資源,更協助新創理解市場、對接客戶,讓技術真正走向商業落地。

也因此,中華電信 5G 加速器引進導師輔導(Mentor)機制,由公司內部主管擔任新創導師,協助潛力新創理解客戶痛點,更進一步把新創帶進實際市場。當既有客戶出現需求時,若新創有符合該需求的解決方案,中華電信便會協助對接客戶,形成所謂的業務協作,為新創帶來新的商機。目前已有超過 20 家新創透過與中華電信的業務協作,將技術轉化為實際訂單與營收,逐步走向規模化發展。

中華電信董事長簡志誠認為,AI時代的關鍵在於「應用落地」與「價值實現」。中華電信期許透過 5G 加速器徵選活動,向廣大新創團隊開放技術資源與實證場域,使其能從概念走向實作,進一步邁向產業化,構建共榮的AI創新生態系。

中華電信5g加速器徵件
一系列輔導資源 X 實證應用落地 X 展會人脈資源鏈結
圖/ 中華電信 5G 加速器

AI、數位韌性成主軸!中華電信 5G 加速器鎖定八大創新場景

延續這樣的理念,中華電信 5G 加速器在舉辦今(2026)年的徵選活動時,瞄準當前產業轉型的關鍵科技,定出數位韌性、智慧驅動、永續未來三大徵選主題,並向下延伸八大應用場景,包括海地星空、智慧製造、智慧醫療、智慧交通、數位娛樂、運動科技、資通安全及創新永續。

除了根據產業趨勢擬定徵選主題,中華電信也擴大去年新設的「特別獎」機制,期以「AI 創新特別獎」與「海地星空特別獎」,鼓勵更多新創團隊投入 AI 應用與新世代通訊網路創新。

從歷屆加速器輔導成果來看,除了有不少團隊與中華電信展開業務協作,還有超過 10 家新創入圍台灣各類 AI 大賞與指標性競賽,顯示中華電信所遴選的新創團隊,確實具備相當高的市場潛力與技術能量。也因此,中華電信今年持續辦理 AI 創新特別獎,為新創提供更多資源與支持,加快其商業落地與市場拓展的腳步。

由於台灣新創的創業主題日趨多元化,除了 AI 應用外,也有越來越多團隊開始投入通訊、網路與數位基礎建設相關領域,對此,中華電信特別設立「海地星空特別獎」新獎項,鼓勵更多新創投入發展創新網路應用,尤其在防災、救災、智慧城市與公共服務等面向,希望以中華電信的韌性網路架構為基礎,結合新創的創新應用模式,為民眾帶來更美好、便利的生活體驗,共同厚植整體社會與國家的數位韌性。

中華電信加速器8大徵件主題
中華電信加速器8大徵件主題
圖/ 中華電信5G加速器

不只拚 AI,更提前布局 6G!中華電信新增「海地星空特別獎」

這項新設立的「海地星空特別獎」,背後其實也呼應中華電信近年持續推動的「海地星空」戰略布局。考量到全球地緣政治風險升高、極端氣候頻繁,加上台灣本身位處地震與天然災害頻繁地區,因此中華電信近幾年積極投入發展海纜、光纖與行動通訊、微波及衛星通訊,打造互為備援、多層次的韌性網路。

這樣的戰略不僅為了回應當前需求,更能替未來 6G 時代提前打下基礎。中華電信以 AI、衛星與多層次網路技術為核心,再透過5G加速器平台與今年新增的「海地星空特別獎」,發掘具潛力的新創團隊與創新應用,讓技術在發展初期就能進入實際場域驗證與商業化探索,並協助串聯產業需求與市場機會,發揮5G加速器作為創新技術落地平台的價值。

對於正在尋找場域驗證、企業合作與市場機會的新創團隊而言,「2026 第八屆中華電信 5G 加速器」不只是一次競賽,更可能成為下一階段成長的重要起點。只要與海地星空、智慧製造、智慧醫療、智慧交通、數位娛樂、運動科技、資通安全及創新永續八大應用場景相關的新創,皆可踴躍報名,與中華電信一同搶進 AI 與數位韌性時代的新商機。

>>2026 第八屆中華電信 5G 加速器

>>立即報名

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓