xAI發布Grok 4.1!性能「打趴Gemini」登頂榜首:跟前一代差在哪?為何幻覺更少了?
xAI發布Grok 4.1!性能「打趴Gemini」登頂榜首:跟前一代差在哪?為何幻覺更少了?

重點一:xAI 推出 Grok 4.1 與 Grok 4.1 Thinking,免費開放且宣稱大幅降低幻覺。

重點二:依 LMArena Text Arena 榜單,Grok 4.1 Thinking 榜首(1510 分),Grok 4.1 排第 19(1437 分)。

重點三:付費用戶可獲較少限制;xAI稱 Grok 4.1 較前版幻覺率降至三分之一。

Elon Musk 旗下 xAI 宣布推出兩款模型:Grok 4.1 與 Grok 4.1 Thinking(思考版),並以免費形式開放使用,付費用戶則享有較低使用限制。

官方強調,此次升級在品質與速度均有進展,其中最重要的指標是「降低幻覺」:xAI 表示 Grok 4.1 相較前代模型,產生錯誤內容的機率下降至約三分之一,為近期最具代表性的版本之一。

雖然頁面以「顯著降低」描述成果,但尚未同步公開具體數值、區間、或統計顯著性檢定方法。整體訊息傳達方向是:在非推理(fast)模型加入搜尋工具、並透過後訓練,能提升面向事實的回答穩定度,降低重大與次要錯誤的出現機率。

至於新模型表現如何? 

根據 lmarena.ai(LMSYS Chatbot Arena)在 X 公布最新「Text Arena」排行榜,Grok 4.1(thinking)以總分1483 登上榜首;在難度更高的「Arena Expert」榜單,該版本同樣以總分1510 奪冠,顯示其於綜合語言理解、推理與生成品質的競爭力。

同系列的 Grok 4.1(一般版)在「Text Arena」位居第2、總分1465,「Expert」榜第19、總分1437

lmarena.ai 並指出,相較兩個月前進入 Arena 的 Grok 4 fast,最新成績「提升超過 40 分」,意味模型在對話穩定性、指令遵循與高難度提示(Hard Prompts)等面向有明顯躍升。

lmarena.ai補充,Grok 4.1(thinking)在「高難度提示詞、編碼、指令執行、創意寫作」等概覽類別表現亮眼,且在「職業排行榜」多數職業領域顯示強勢,

Grok 4.1為何幻覺更少了?

頁面明確交代評測框架:採用「非推理模型+網路搜尋工具」進行回答,並以「幻覺率」作為核心品質指標。

白話來說,就是讓「不做深度推理的快速模型」搭配「網路搜尋工具」去回答問題,然後把回答裡每一句可被查證的小事實(原子主張)逐一比對,看有沒有重大或次要錯誤,最後把各題的錯誤比例平均,這個平均值就是「幻覺率」。

此做法符合目前檢核事實一致性的主流思路,但細節如原子主張切分準則、標註者一致性(IAA)、與錯誤分級標準,頁面未見公開;因此,外界暫時只能根據定義理解方向,尚無法重現驗證。

強敵環伺!Gemini 3.0成關注焦點

此次雙版本免費釋出,明確強化 xAI 在用戶擴張上的策略,為開發者與一般用戶提供入門門檻更低的使用選項;同時透過付費方案降低頻率與容量限制,維持商業化的可持續性。

從產品訊息來看,Grok 4.1 的訴求為「更可靠、更快速」,核心賣點鎖定降低幻覺與整體表現提升。「Thinking」版則展現更高階的推理與對話品質,反映出 xAI 對多場景推理能力的重視。

另一方面,競品壓力不減:OpenAI 持續迭代至 GPT 5.1,Google 亦可能以 Gemini 3.0 再度抬高性能天花板。對使用者而言,短期可將 Grok 4.1 視為一個在可靠性上有所強化、且擁有可觀基準成績的免費選項;中期則關注其在更廣泛任務中的真實表現與資源限制的影響。

延伸閱讀:馬斯克又出手!SpaceX豪擲20億美元投資xAI,估值衝上3.3兆元

「地表最強模型」來了!Grok-3挾3種模式發布,馬斯克:你100%會愛上它

資料來源:xAILMarenaBleep Computer

本文初稿為AI編撰,整理.編輯/ 李先泰

關鍵字: #Grok #xAI
往下滑看下一篇文章
從產品安全到營運韌性:合勤集團揭 AI 時代資安新戰略
從產品安全到營運韌性:合勤集團揭 AI 時代資安新戰略

隨著歐盟《網路韌性法案》(CRA)正式進入倒數計時,企業面臨的資安考驗也從針對內部 IT 環境的駭客攻防戰,一路延伸到產品對外銷售與供應鏈治理的市場生存戰。

AI 正加速漏洞挖掘、自動化攻擊與供應鏈風險擴散,企業也更難只用傳統 IT 防護思維面對產品安全問題。

站在這股趨勢浪潮的最前線,合勤集團整合旗下三家子公司—黑貓資訊、兆勤科技與勤晁科技的技術量能,不僅於CYBERSEC 2026台灣資安大會展出全方位解決方案,也進一步分享如何將CRA法規遵循轉化為實務布局的寶貴經驗,透過自身轉型歷程,協助台灣企業跳脫被動合規思維,將CRA從合規壓力逐步轉化為產品治理與市場競爭力。

當CRA成為市場門票,企業該如何建立產品安全治理能力?

合勤投資控股公司資安長游政卿指出,CRA正式生效後,產品若未符合CRA 要求,將可能影響CE合規與歐盟市場銷售。更重要的是,CRA要求的不只是產品出貨當下符合規範,而是整個產品生命週期都必須被持續管理,且必須留下具可追溯性的完整紀錄。

合勤集團資安長游政卿
合勤投資控股公司資安長游政卿
圖/ 數位時代

因此,對台灣企業而言,CRA帶來的壓力不只是罰款,而是產品遭下架、召回,甚至進一步引發銷售通路中斷、品牌聲譽受損與客戶轉單等連鎖衝擊。對此,游政卿建議企業可依照CRA法規時程,兩階段建立合規能力。

在 2026 年應優先補強「通報即戰力」,亦即成立產品安全事件應變小組(PSIRT),建立漏洞通報與應變機制,確保當新漏洞出現時,企業能在第一時間做出正確判斷,包括該漏洞是否已被利用及嚴重程度、哪些產品與版本受到影響、是否達到CRA通報門檻及如何進行修補與升級。「就像汽車召回制度一樣,企業必須能快速掌握受影響的產品、版本與客戶範圍,並立即啟動應變機制。」游政卿說。

到了 2027 年,則應進一步將合規能力全面制度化與規模化。游政卿強調,企業不能再抱持「有問題再修補」的思維,而是必須從產品設計階段就導入「Security by Design(安全設計)」概念,並在產品整個生命週期中持續進行漏洞監控、更新維護與風險管理。換言之,企業真正需要建立的,不只是單一產品的資安能力,而是一套從設計、開發、測試、上市,到後續漏洞修補、客戶通知與紀錄保存,都能長期穩定運作的產品安全治理機制。

在此基礎上,黑貓資訊通過 TAF ISO/IEC 17025 認證的資安測試實驗室,可出具 ILAC MRA 國際互認報告,不僅能找出產品漏洞,還能協助企業建立具公信力的安全證明,確保產品安全與合規性。

Nebula 雲地聯防平台:讓企業從「看不見風險」到快速應變

在產品安全端,企業需要建立CRA合規能力,落實產品從設計、開發到漏洞修補的全生命週期治理;而在資訊安全端,則必須具備持續監控、快速應變與營運復原的能力,才能有效因應AI時代下愈來愈高頻、愈來愈自動化的攻擊威脅。

兆勤科技總經理蔡明見進一步說明,AI 正大幅改變資安攻擊的態樣,不僅讓攻擊成本明顯下降,攻擊速度與頻率也快速提升,攻擊目標更從過去的大型企業,逐漸轉向防禦能力相對薄弱的中小企業,尤其勒索軟體攻擊更明顯增加。許多中小企業因缺乏備援與復原能力,遭受攻擊後往往只能選擇支付贖金,進而衍生營運中斷與資料遺失等風險。

在此背景下,企業需要思考的,已不僅只是「防堵威脅」,更重要的是,當攻擊發生後,能否持續營運與快速復原。瞄準這樣的需求,兆勤透過自行研發的 Nebula雲端管理平台提升資安可視性,讓企業能夠「看見風險」,進而做好防禦、預警與應變。透過Nebula雲地整合架構,企業可將有線、無線及資安設備全面整合至單一平台進行管理。蔡明見表示,管理者不需分別學習與使用不同管理介面,即可掌握整體網路與資安狀態,大幅降低資安管理的複雜度、人力需求與技術門檻。

此外,Nebula提供圖像化儀表板與彈性報表功能,協助企業快速掌握攻擊來源、異常流量與高風險設備等資訊,進一步優化資安策略與決策效率。同時平台亦導入 AI 助手功能,讓管理者可透過自然語言查詢資安資訊,例如直接詢問「上個月前十大攻擊來源」,系統即可自動生成分析結果與視覺化報表,提升資訊取得效率。

兆勤科技總經理蔡明見
兆勤科技總經理蔡明見
圖/ 數位時代

面對 MSP(Managed Service Provider,託管服務商)發展趨勢,兆勤也持續開發更多 MSP 管理功能,包括客戶設備管理、授權管理等,協助合作夥伴更有效率地服務終端客戶、降低維運與管理負擔,進而吸引更多傳統經銷夥伴轉型為 MSP 業者,加速服務模式轉型與台灣 MSP 生態系發展。

至於勤晁科技則針對量子運算與跨域滲透威脅,提出「虛實整合防線」的新思維。防護架構由內而外拆解為三層:首先是運用邏輯防護(PQC)演算法進行加密、確保資料的長期安全性;其次是進行異常偵測、運用 AI 分析多維流量,即時發現異常行為;第三是建立物理韌性(Air Gap),以單向光纖傳輸築起不可逆的安全邊界。透過這套從邏輯、行為到物理層的縱深防禦機制,為國家級關鍵系統構築最穩固的安全韌性。

資安不只是 IT 部門的防守任務,而是攸關產品能否進入國際市場、企業能否持續營運的重要競爭力。合勤集團希望透過黑貓資訊、兆勤科技與勤晁科技的整合布局,從產品安全、資安防護到關鍵場域防禦,逐步提升企業的資安韌性,並協助企業從被動合規走向主動升級,在快速變化的全球市場中建立長期競爭優勢。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
代理式商務連動百兆商機
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓