重點一:馬斯克旗下 xAI 推出新一代旗艦 AI 模型 Grok 4,並發布每月300美元的高階訂閱方案,直接挑戰 OpenAI 與 Google 的市場地位。
重點二:xAI 宣稱 Grok 4 在多項關鍵基準測試中表現卓越,其性能在部分評測上已超越 Google 的 Gemini 2.5 Pro 和 OpenAI 的模型。
重點三:在 Grok 模型爆發反猶言論爭議,以及社群平台 X 執行長離職的動盪之際發布新品,為其商業化前景與企業信任度帶來考驗。
伊隆·馬斯克 (Elon Musk) 旗下的人工智慧公司 xAI 於台灣時間周四發布其最新的旗艦級 AI 模型 Grok 4,並同步推出名為 「SuperGrok Heavy」 的頂級訂閱服務,月費高達300美元(約為新台幣8,770元),此方案提供最強大的Grok 4 Heavy模型的使用權,但訂閱費比Google AI Ultra的每月收費250美元,以及OpenAI ChatGPT Pro的每月收費200美元還要更貴。
五大AI模型頂級方案比一比
AI名稱 | 方案名稱 | 每月價格 (美元) | 目標客群 | 核心功能 |
---|---|---|---|---|
Grok | SuperGrok Heavy | $300 | 進階用戶、追求極致AI能力者 | 使用Grok 4 Heavy模型、深度搜尋、強化推理 |
Gemini | Ultra Plan | $249.99 | 創意專業人士、開發者 | 使用Google最強大的AI模型、整合Google Workspace |
ChatGPT | ChatGPT Pro | $200 | 重度用戶、專業研究者 | 無限制使用頂尖模型 (如GPT-4o)、深度研究、多媒體生成 |
Claude | Claude Max Ultimate | $200 | 重度商業用戶、企業級應用 | Pro方案20倍使用量、高峰時段優先權、優先體驗新模型 |
Perplexity | Perplexity Max | $200 | 專業人士、研究員、重度用戶 | 無限制使用多種頂尖AI模型、無限次使用Labs工具、優先體驗新產品 (如Comet瀏覽器) |
據《Tech Church》報導,Grok 4 不僅能分析圖像並回應問題,更深度整合至馬斯克的社群網路 X 平台。儘管外界對其寄予厚望,期待它能與 OpenAI 預計於今夏稍晚推出的 GPT-5 一較高下,但 xAI 近期面臨的內部動盪與旗下模型的言論爭議,也為這次發布會蒙上一層陰影。
宣稱性能超越群雄,多項基準測試奪冠
xAI 強調 Grok 4 在學術問題上的表現已超越博士水準,馬斯克更在直播中表示:「Grok 4 在所有學科上都優於博士,無一例外。」他坦言模型有時可能缺乏常識,也尚未發明新技術或發現新物理學,但他認為這只是時間問題。
為證明其強大性能,xAI 公布了多項基準測試成績。在衡量 AI 回答數千個人文、數學等眾包問題能力的「Humanity's Last Exam」測試中, Grok 4 在無工具輔助下獲得 25.4% 的分數,超越了 Google Gemini 2.5 Pro 的 21.6% 及 OpenAI o3 (high) 的 21%。
而其「多代理版本」Grok 4 Heavy 在工具輔助下,分數更高達 44.4%,大幅領先 Gemini 2.5 Pro 的 26.9%。 此外,在另一項高難度的視覺模式識別測試 ARC-AGI-2 中,Grok 4 以 16.2% 的成績創下新紀錄,幾乎是次世代商用模型 Claude Opus 4 的兩倍。
根據第三方單位Artificial Analysis測試評比目前市場上所有的先進AI模型, Grok 4 在智慧指數 (Artificial Analysis Intelligence Index)中以 73 分的成績位居榜首。 緊隨其後的是 03-pro (72分)、Gemini 2.5 Pro (70分) 和 03 (70分),這些模型的分數都非常接近,為第一領先集團。
至於Anthropic旗下的Reason-4 Opus (64分),以及Claude 3 Sonnet Thinking (61分),分別拿下第10名與第14名;而科技巨頭中的末位者,則為Meta 的 Llama 系列, Llama 4 Maverick (51分) 和 Llama 4 Scout (43分) ,位於倒數之列。
值得注意的是,在智慧指數前10名中,有兩個中國公司開發的模型,分別是DeepSeek R1 (68分)排名第6,以及第10名的Minimax M1 80k (63分)。
Grok 4 有哪些亮點功能?
根據目前公開資訊,位居目前市場中訂閱費最高的Grok 4(SuperGrok Heavy方案)具備以下幾項亮點功能:
1. 進階推理能力
Grok 4 在 xAI 的 Colossus 超級電腦上訓練,強調「科學家等級」的邏輯推理與文字生成能力,目標是能處理更複雜的問題與推理任務。
2. 多模態功能
Grok 4 支援文字、圖像和語音輸入,並具備圖像生成能力。雖然目前圖像識別功能仍在改進中,但其生成高品質圖片的速度快(通常 10-20 秒),適合創作者和需要圖文整合的場景。
3. 專用編碼模式(Grok 4 Code)
Grok 4 推出專為程式設計打造的 Grok 4 Code 模型,支援高階程式任務,可嵌入程式碼編輯器(如 Cursor),並提供自動化流程和代碼調試功能,特別適合開發者和工程團隊。這使其成為專業編碼應用的強大工具。
4. 即時檢索與 X 平台整合(RAG 架構)
Grok 4 採用檢索增強生成(RAG)技術,與 X 平台深度整合,能即時擷取 X 上的貼文、趨勢和公開資訊,提供具時效性的回答。這對於媒體、評論產業和需要快速掌握社群動態的用戶尤其有用。
5. 自然語音互動
Grok 4 Voice 提供更自然、接近真人的語音互動,減少對話中斷。此外,語音模式升級後更自然,支持低延遲對話,甚至可模擬唱歌或小聲說話。
6. 網路文化理解
Grok 4 對網路迷因、流行語、幽默等有更高的理解度,強調「網感」與文化流暢度,適合重度網路用戶。
反猶言論延燒!xAI商業化之路挑戰重重
儘管 Grok 4 在技術指標上表現亮眼,xAI 的商業化之路卻非一片坦途。就在新品發布的同一天,在 X 公司任職約兩年的執行長琳達·雅克里諾 (Linda Yaccarino) 宣布離職,繼任人選懸而未決。
數天前,Grok 的官方自動化 X 帳號更因發表批評好萊塢「猶太高管」並讚揚希特勒的反猶言論而引發軒然大波,迫使 xAI 暫時限制該帳號並刪除爭議貼文。此事件讓外界質疑 Grok 的可靠性與安全性,也讓 xAI 在向企業推廣 Grok 作為 ChatGPT、Claude 和 Gemini 的替代方案時,面臨嚴峻的信任考驗。
為拓展市場,xAI 正透過 API 釋出 Grok 4,並計劃與超大規模雲端服務商合作,但能否說服企業客戶接納這個性能強大卻又充滿爭議的 AI 模型,仍有待市場觀察。
延伸閱讀:OpenAI宣戰Google!將推「AI瀏覽器」挑戰Chrome市占霸權:為何Browser是AI終極戰場?
讓LINE化身智慧助理!AI回覆客戶、自動備份檔案、整理待辦事項... 6大應用情境一次盤點
資料來源:techcrunch、36KR、xAI
本文初稿為AI編撰,整理.編輯/ 李先泰