Claude 3 擠下 GPT-4,全球最強AI模型一夕換人!秒讀萬字、幻覺率大幅降低,強在哪?
Claude 3 擠下 GPT-4,全球最強AI模型一夕換人!秒讀萬字、幻覺率大幅降低,強在哪?

獲亞馬遜、Google投資的Anthropic,本周發表了Claude 3系列模型,號稱優於包括GPT-4在內的所有競爭對手,是目前最快最強大的模型,甚至在某些任務上展現「接近人類」的能力。

「今天,我們宣布推出Claude 3系列模型,它對廣泛的認知任務(cognitive tasks)奠定了新的產業標準。」Anthropic在官網上表示。

Anthropic推出全新模型「Claude 3」,比GPT-4更強大

Anthropic發布模型分別有Claude 3 Haiku、Claude 3 Sonnet及Claude 3 Opus三種型號,性能以低到高排列,針對不同的需求、成本提供用戶選擇。目前Opus和Sonnet可以在Claude.ai上及Claude API中使用,不過Opus需要訂閱每月20美元的Claude Pro才能使用,Haiku則即將推出。

Anthropic給予了各個模型不同的定位:

  • Claude 3 Opus: 是Anthropic最為先進的模型,擁有逼近人類理解能力及流暢性,用於極為複雜的任務及開放式的提示詞。

  • Claude 3 Sonnet: 是聰明程度與速度之間取得平衡的模型,有著比同類產品更實惠、高CP的表現,專為大規模使用AI時所需的高耐用性設計

  • Claude 3 Haiku: 最小輕巧、快速的模型,有著近乎即時的回應能力,能夠快速回答簡單問題,用於與用戶的即時互動。

Anthropic聲稱,在大多數的測試方面,這次發布中最強大的Opus都優於檯面上的各大AI模型,包括大學水準的專家知識(MMLU)、研究生水準的專業推理(GPQA)、基礎數學(GSM8K)等都取得超越GPT在內各家AI模型的成績,並且在複雜任務上表現出接近人類水準的理解能力及流暢程度。

claude-3.jpg
圖/ Anthropic

同時在視覺能力上,Claude 3系列模型也有著與競爭對手相當的表現,可以處理從照片、圖表到技術圖表等複雜的視覺內容。

Anthropic指出,許多客戶的知識庫裡超過一半都是PDF、流程圖和投影片等各種類型的視覺內容,他們很高興能為客戶提供這種新的模態。值得注意的是,雖然Claude 3系列模型可以處理圖像,但不會生成圖像內容。

claude-3 02.jpg
圖/ Anthropic

根據《CNBC》報導,Anthropic指出Claude 3大約可以處理約15萬個單字(20萬代幣)的文本,相當於一本《白鯨記》或《哈利波特:死神的聖物》,過去的版本只能處理約7.5萬個單字。

而在Anthropic揭露的資料中,最輕量級的Haiku可以在不到3秒的時間內,處理完包含各種複雜圖表、字符量1萬代幣規模的研究論文。

而在價格方面,Anthropic為Opus開出輸入15美元/每百萬代幣、輸出75美元/每百萬代幣的費用,這個價格遠高於GPT-4 Turbo輸入10美元/每百萬代幣,輸出30美元/每百萬代幣,或許也代表著Anthropic對自家模型的足具信心。

延伸閱讀:研究人員揭露:Claude 3曾吐:我知道你在測試我!AI真的有心智能力嗎?

大幅降低模型「幻覺率」,Anthropic致力讓Claude 3更安全

聊天機器人很容易受到誤導、或者對問題理解不充分而回答出捏造的答覆,這個情況被稱為「幻覺」(hallucination),也被認為是催生假消息的可能源頭。

Anthropic也試圖透過出Claude 3解決這個問題,聲稱在測試一系列特別刁難、複雜的問題時, Opus模型回答的正確率已經達到舊模型的兩倍以上 ,大幅減少了錯誤回應的比例。不過他們也坦承完全解決這個問題並不容易,「幻覺率要達到零是非常困難的。」Anthropic總裁阿莫戴(Daniela Amodei)表示。

「沒有一個模型是完美的,我認為應該要事先說清楚。」阿莫戴強調,「我們傾盡全力讓模型更安全、強大,當然還是有些時候會捏造回應。」

資料來源:AnthropicBloombergCNBC

延伸閱讀:ChatGPT最強對手「Claude」開放台灣註冊、兩步驟免費用!能讀整本書?支援中文?

責任編輯:林美欣

往下滑看下一篇文章
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝
健細胞科技攜手中興大學,推出「Cancell Insight」醫療AI 輔助決策平台,消弭醫療數位鴻溝

為打破醫療 AI 高昂的算力與人力門檻,健細胞科技與國立中興大學資管系蔡孟勳教授團隊產學合作,正式推出「Cancell Insight 醫療 AI 模型平台」(https://insight.cancell.ai)。該平台以 SaaS(軟體即服務)模式提供一站式託管,讓先進的醫療 AI 資源不再侷限於大型醫學中心,有效消弭基層與城鄉間的醫療數位鴻溝。

軟體硬實力:打通 AI 落地最後一哩路

過去,許多由學術或生技單位開發的優秀模型因缺乏部署工具,往往淪為「實驗室孤兒」;而中小型醫院也常因 IT 建置成本對 AI 望之卻步。

健細胞科技創辦人周子堯Victor憑藉其UIUX規劃、程式開發技術背景,親自領軍AI 模型研發團隊,建構 Cancell Insight 平台。他強調,智慧醫療落地必須具備「無感化部署」、「持續性反覆運算」與「大眾化使用」三大要素。Cancell Insight 包辦了從數據清潔、標註到模型訓練與部署的底層工程,醫療機構僅需提供去識別化數據,繁瑣技術難題全由平台解決,讓 AI 真正回歸醫療「輔助」本質。

專為高壓臨床環境設計,七大核心優勢重新定義臨床運作效率

健細胞科技
Cancell Insight提供涵蓋數據清洗、精準標註、模型訓練至部署託管的一站式解決方案
圖/ 健細胞科技

【行動化與 LINE 整合】 支援 LINE 一鍵登入,醫師可直接透過官方帳號上傳檔案呼叫模型並查閱紀錄,實現真正的醫療行動化。

【隨選模型與高相容性】 提供多元 AI 模型庫供彈性訂閱。每組模型具備獨立 API Key,可無縫串接醫院現有 HIS 系統或 APP。

【團隊協作共享】 首創以「團隊」為服務單位,跨科別成員可同步共享模型權限、數據分析與歷史紀錄,提升研究協調效率。

【自動化數據處理】 支援模板批次上傳,內建自動校準系統,若格式不符將自動轉檔、去識別化與重構,大幅解放 IT 人力。

【雙模態 AI 解析】 深度整合 Dr.Cell AI (Gemini) 多模態能力,不僅輸出預測結果,更提供進階臨床解說與治療準則問答,提升決策參考價值。

堅守醫療嚴謹性,推動醫療平權與永續商業價值

在追求科技創新的同時,Cancell Insight 嚴格把關醫療安全性。平台所有 AI 模型輸出結果均定位為「臨床決策輔助」與「研究檢測輔助」,透過「非直面病患」的機制,確保所有 AI 建議皆由專業醫療人員進行最終判讀。

透過 SaaS 專案訂閱模式,Cancell Insight 成功以合理經費取代了傳統的高額硬體採購,讓中小型醫院與偏鄉診所也能具備同等的診斷實力,落實真正的醫療平權。對研發端而言,平台不僅是加速醫療科技商用化、縮短變現週期的推進器,其高度結合日常工作流的特性,更有效減少了醫護的行政負荷,緩解當前醫療量能短缺的危機。

【進階部署】啟動臨床試驗,Docker 地端部署確保資安與時效

為進一步驗證臨床效益並符合醫療機構對資訊安全的高標準,Cancell Insight 即將與各大醫療機構攜手展開「臨床研究計畫」。針對有高度資安控管需求的醫院,平台提供彈性的 Docker 地端模型部署(On-premise Deployment) 方案。第一線的醫師與護理師可直接在院內本機端快速啟動 AI 模型,安全地注入病患臨床數據後,即可「零時差」取得預測結果。此舉不僅確保了敏感醫療數據「不出院」,完美符合嚴格的醫療法規與病患隱私要求,更能實際驗證 Cancell Insight 在真實高壓的臨床場域中,能即時、有效地提供精準的決策輔助。

健細胞科技
部署輕量化模型於地端,支援離線模式使用模型,完善保護企業敏感資料
圖/ 健細胞科技

展望未來,擴大智慧醫療生態圈

透過 SaaS 模式取代高額硬體採購,Cancell Insight 致力落實醫療平權。未來,健細胞科技將以此平台為樞紐,尋求跨界深度合作:

醫療機構: 提供各級別醫院隨選即用的 AI 助理及地端部署選項。
學術/生技: 協助實驗室模型落地,並優化新藥研發與臨床試驗的數據處理效率。
商業保險: 整合 AI 評估工具,提供更精準的健康管理與風險控管服務。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
AI全球100+台灣20
© 2026 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓