xAI 宣布推出最新的語言模型 Grok-2 和 Grok-2 mini,兩者均在X平台上提供Beta測試版!
𝕏 新聞稿指出 ,Grok-2是目前最先進的AI語言模型,具備卓越的推理、聊天與編碼能力,並在 LMSYS聊天機器人競賽中展現強大實力,擊敗 GPT-4 Turbo和 Claude 3.5 Sonnet。
而Grok-2 mini則是Grok-2的小型版本,雖規模較小,但依然能夠提供高效準確的回應。xAI將於本月稍晚通過企業API向開發者提供這兩個模型的服務。
效能更勝GPT4-o與Claude 3.5 Sonnet!
𝕏 指出,Grok-2 和 Grok-2 mini 在多個學術基準測試中表現出色,展現了領先的語言推理能力。這些測試包括 GPQA(研究生水準的科學知識)、MMLU(通用知識測試)和 MathVista(視覺數學推理)等。
在LMSYS領導榜上, Grok-2 以代號「sus-column-r」參加競賽,並在綜合分數上超越了 GPT-4 Turbo 和 Claude 3.5 Sonnet,成為目前領先的模型。
𝕏 指出, Grok-2 將提升 𝕏 平台的用戶體驗。𝕏 Premium 和 Premium+ 用戶現在可以透過最新版本的 𝕏 應用程式,使用Grok-2 作為AI助手,能夠在找答案、寫作或解決編碼問題上發揮作用。
𝕏平台未設限制措施,AI生圖狂歪樓
Grok-2 的圖像生成功能由 Black Forest Lab 的 Flux 1 AI 模型提供支持,允許用戶根據提示生成,並直接發布圖像至 𝕏 平台。
值得注意的是,由於目前 𝕏 平台沒有設置任何限制措施,導致創意爆棚的網友們不斷發布涉及知名人物的AI生成圖像。
例如,美國共和黨總統參選人川普,及現任副總統賀錦麗,這些圖像不但顯示他們持槍或使用非法藥物,且這些由 Grok 生成的圖像並未顯示任何 AI 生成的標識,這可能進一步加劇公眾的疑慮。截至目前,xAI 尚未就圖像生成功能的限制進行回應。
延伸閱讀:馬斯克猛攻AI!擬透過特斯拉向xAI投資50億美元,為何專家勸他「先不要」?
Google前CEO一席話惹議:遠端工作是AI落後關鍵!為何他點名台積電是血汗典範?
資料來源:《X》、《The Verge》、《Tech Church》
本文初稿為AI編撰,整理.編輯/ 李先泰
