Claude 3 擠下 GPT-4,全球最強AI模型一夕換人!秒讀萬字、幻覺率大幅降低,強在哪?
Claude 3 擠下 GPT-4,全球最強AI模型一夕換人!秒讀萬字、幻覺率大幅降低,強在哪?

獲亞馬遜、Google投資的Anthropic,本周發表了Claude 3系列模型,號稱優於包括GPT-4在內的所有競爭對手,是目前最快最強大的模型,甚至在某些任務上展現「接近人類」的能力。

「今天,我們宣布推出Claude 3系列模型,它對廣泛的認知任務(cognitive tasks)奠定了新的產業標準。」Anthropic在官網上表示。

Anthropic推出全新模型「Claude 3」,比GPT-4更強大

Anthropic發布模型分別有Claude 3 Haiku、Claude 3 Sonnet及Claude 3 Opus三種型號,性能以低到高排列,針對不同的需求、成本提供用戶選擇。目前Opus和Sonnet可以在Claude.ai上及Claude API中使用,不過Opus需要訂閱每月20美元的Claude Pro才能使用,Haiku則即將推出。

Anthropic給予了各個模型不同的定位:

  • Claude 3 Opus: 是Anthropic最為先進的模型,擁有逼近人類理解能力及流暢性,用於極為複雜的任務及開放式的提示詞。

  • Claude 3 Sonnet: 是聰明程度與速度之間取得平衡的模型,有著比同類產品更實惠、高CP的表現,專為大規模使用AI時所需的高耐用性設計

  • Claude 3 Haiku: 最小輕巧、快速的模型,有著近乎即時的回應能力,能夠快速回答簡單問題,用於與用戶的即時互動。

Anthropic聲稱,在大多數的測試方面,這次發布中最強大的Opus都優於檯面上的各大AI模型,包括大學水準的專家知識(MMLU)、研究生水準的專業推理(GPQA)、基礎數學(GSM8K)等都取得超越GPT在內各家AI模型的成績,並且在複雜任務上表現出接近人類水準的理解能力及流暢程度。

claude-3.jpg
圖/ Anthropic

同時在視覺能力上,Claude 3系列模型也有著與競爭對手相當的表現,可以處理從照片、圖表到技術圖表等複雜的視覺內容。

Anthropic指出,許多客戶的知識庫裡超過一半都是PDF、流程圖和投影片等各種類型的視覺內容,他們很高興能為客戶提供這種新的模態。值得注意的是,雖然Claude 3系列模型可以處理圖像,但不會生成圖像內容。

claude-3 02.jpg
圖/ Anthropic

根據《CNBC》報導,Anthropic指出Claude 3大約可以處理約15萬個單字(20萬代幣)的文本,相當於一本《白鯨記》或《哈利波特:死神的聖物》,過去的版本只能處理約7.5萬個單字。

而在Anthropic揭露的資料中,最輕量級的Haiku可以在不到3秒的時間內,處理完包含各種複雜圖表、字符量1萬代幣規模的研究論文。

而在價格方面,Anthropic為Opus開出輸入15美元/每百萬代幣、輸出75美元/每百萬代幣的費用,這個價格遠高於GPT-4 Turbo輸入10美元/每百萬代幣,輸出30美元/每百萬代幣,或許也代表著Anthropic對自家模型的足具信心。

延伸閱讀:研究人員揭露:Claude 3曾吐:我知道你在測試我!AI真的有心智能力嗎?

大幅降低模型「幻覺率」,Anthropic致力讓Claude 3更安全

聊天機器人很容易受到誤導、或者對問題理解不充分而回答出捏造的答覆,這個情況被稱為「幻覺」(hallucination),也被認為是催生假消息的可能源頭。

Anthropic也試圖透過出Claude 3解決這個問題,聲稱在測試一系列特別刁難、複雜的問題時, Opus模型回答的正確率已經達到舊模型的兩倍以上 ,大幅減少了錯誤回應的比例。不過他們也坦承完全解決這個問題並不容易,「幻覺率要達到零是非常困難的。」Anthropic總裁阿莫戴(Daniela Amodei)表示。

「沒有一個模型是完美的,我認為應該要事先說清楚。」阿莫戴強調,「我們傾盡全力讓模型更安全、強大,當然還是有些時候會捏造回應。」

資料來源:AnthropicBloombergCNBC

延伸閱讀:ChatGPT最強對手「Claude」開放台灣註冊、兩步驟免費用!能讀整本書?支援中文?

責任編輯:林美欣

往下滑看下一篇文章
決策桌上的虛擬團員:臺大 EiMBA 如何將 AI 從「工具」升級為「共創夥伴」?
決策桌上的虛擬團員:臺大 EiMBA 如何將 AI 從「工具」升級為「共創夥伴」?
2025.12.09 | 創新創業

「過去我們教育教導學生如何從數據中找出標準答案,但在生成式AI的時代,標準答案往往是最廉價的。」臺大EiMBA執行長李家岩一語道破了這波商業典範轉移的核心。他認為,當資訊獲取邊際成本趨近於零,企業的競爭優勢已不再是單純的「掌握資訊」,而是「如何設計讓 AI 與人共同創造價值的流程」。這不只是一句口號,而是一場正在被驅動的轉型。從課程設計的邏輯重組,到學生創業專題的實戰演練,臺大EiMBA正將校園打造成一個允許失敗、快速驗證的「人機共創實驗場」。

告別標準答案,當教授變成「學習架構師」

「我們不再只是教導知識,而是設計學習。」李家岩指出,臺大EiMBA的課程正在經歷結構性的轉變。現在的教授角色更像是一位「學習架構師(Learning Architect)」,他們的任務不是單向輸出,而是設計出高強度的挑戰與情境,讓學生在解決問題的過程中,自然地將 AI 納入決策迴路 。

以今年新開設的「雙軸轉型與人工智慧」課程為例,這並非傳統的技術概論課,而是場關於商業邏輯的壓力測試。學生不再只是繳交一份靜態的商業計畫書,反而被要求運用生成式 AI 輔助設計商業模式畫布(Business Model Canvas),甚至利用Vibe Coding技術讓不懂程式語言的商管學生,也能透過自然語言與提示工程,快速生成互動式的原型與操作介面來模擬市場反應 。這項技術打破了傳統「文組企劃、理組執行」的藩籬,讓創意能即時轉化為可執行的程式碼。在這個過程中,AI 扮演的角色並非代筆的秘書,而是將概念具現化的加速器,以及最嚴厲的邏輯質疑者。

bn圖說女生.jpg
寵物百分百用戶體驗暨品牌行銷中心負責人鐘紫瀕
圖/ 數位時代

「這是我在課程中學到最深刻的一課,」臺大EiMBA二年級生、寵物百分百用戶體驗暨品牌行銷中心負責人鐘紫瀕分享道。身處近200人新創組織的高階主管,她坦言最初員工對 AI 充滿敬畏,甚至恐懼被取代。但在 EiMBA 的課堂上,她發現 AI 真正的價值在於「攻防」與「鏡像」。「老師設計了一種『沙漏式』的提問邏輯,迫使我們把策略餵給AI後,必須面對它無情的反問。」鐘紫瀕回憶,「這個市場假設有數據支持嗎?」、「你的競爭壁壘在哪裡?」這種高強度的追問,都是AI在對學員提出的挑戰,迫使她必須思考得比AI更深、更遠。「以前我們忙著找答案,現在我們學會如何設計出『連 AI 都沒想過的好問題』。AI就像一面鏡子,映照出我們思考邏輯上的盲點。」

數位孿生實戰,將「感覺」轉化為「數據決策」

除了策略層面的思維激盪,AI 在營運端的落地應用,更是讓許多直覺型創業者經歷了一場痛苦卻必要的轉型。臺大EiMBA一年級生、赤赤子設計師林宏諭對此感觸良多。

身處傳統服裝產業,過去他的經營模式多仰賴美感與經驗,「以前做決策就是憑感覺,甚至忙不過來時,連縫扣子這種小事我都自己跳下去做。」但在李家岩講授的「雙軸轉型與人工智慧」課堂上,他被迫面對冰冷的數據與流程,而這正是李家岩強調的「數位孿生(Digital Twin)」素養 。

台大EiMBA圖說一
赤赤子設計師林宏諭
圖/ 數位時代

在虛擬世界中建立一個與真實工廠或商業流程一模一樣的模型,利用AI進行模擬與預測,是現代智慧製造的核心。對林宏諭而言這意味著必須將腦中抽象的「職人經驗」轉化為AI讀得懂的 SOP。「那段過程就像是被老師架著刀子往前走,非常痛苦,」林宏諭形容,為了讓 AI 能協助優化流程,他必須把每一個步驟定義清楚,無法再用「大概」、「憑感覺」含糊帶過 。

雖然煎熬但成果是豐碩的。當感性的創意被裝進理性的數據框架後,林宏諭發現自己的決策不再是賭博,而是可被驗證的科學。「現在AI不僅幫我理清思緒,更像是團隊的外掛大腦。我開始能鼓勵員工使用AI釋放重複性勞動,讓大家能準時下班,去做更有價值的事。」這正是課程希望帶給學員的轉變,從「事必躬親的管理者」進化為「善用工具的跨域系統設計者」。

bn圖說二.jpg
臺大EiMBA執行長李家岩
圖/ 數位時代

跨域共創,打破同溫層的「破壁效應」

如果說AI是另一位虛擬組團員那麼課堂上原本的同學們,就是來自多重宇宙的戰友。這裡匯聚了醫師、網紅、工程師、律師與傳產二代,如此多元的背景在AI的催化下,產生奇妙的化學反應。

李家岩特別提到了榮獲霍特獎(Hult Prize)肯定的「RiiVERSE」團隊。這個由臺大管院 EiMBA 與 GMBA 學生組成的團隊,成員涵蓋了時尚、行銷與創新創業等不同領域。他們利用舊衣回收再製技術,打造出循環經濟的生態圈。「這就是我們強調的跨域共創。」李家岩解釋,在過去,不同領域的專業人士溝通成本極高,但現在,AI成為了通用的翻譯機與黏著劑。

「AI不僅降低了技術門檻,讓文組生也能做Prototype,更讓理組生也能懂得商業敘事。」在這樣的環境下,創新不再是單打獨鬥,而是像RiiVERSE團隊一樣,結合理性與感性,共同回應全球永續(ESG)的艱鉅挑戰。

為了內心的狂熱,動手去做

然而,隨著AI涉入決策越來越深,一個核心問題浮現:在演算法能預測趨勢、生成文案甚至編寫程式的時代,人類領導者的價值還剩下什麼?「我們教的不是被AI取代,而是擴增智慧。」李家岩眼神堅定地說。他強調,未來的領導者必須具備三項關鍵特質:AI素養、跨域系統設計能力,以及科技人文的反思力 。

其中最關鍵的,是懂得界定「自主邊界(Autonomous Boundary)」。領導者必須清楚判斷:哪些決策該放手讓 AI 自動化?哪些時刻必須保留人類的溫度與價值判斷?「例如在智慧工廠中,AI 可以預測機台何時需要維修保養,但『什麼樣的風險可以接受』、『我們要解決什麼社會問題』,這些涉及價值觀的決策,永遠需要人類來定奪。」李家岩補充道 。

bn圖說三.jpg
寵物百分百用戶體驗暨品牌行銷中心負責人鐘紫瀕(左)/臺大EiMBA執行長李家岩(右)
圖/ 數位時代

在李家岩眼中,真正的創新往往不是來自同類型人才的討論,而是從不同背景、不同世界觀的碰撞中誕生。「一個人能看到的只是片段,跨域合作才能讓問題完整。」他再次提到。對他而言,EiMBA 想培養的不是知道最多的人,而是能讓「各種智慧」一起工作的人。在AI與人類智慧並存的年代,領導者最重要的能力,不是掌握所有答案,而是打造一個能讓答案自然生成的組織環境。「未來需要的領導者是能整合技術與人、懂得跨域系統思考、也能『擇人(含機器人)而任勢』的人。」李家岩說,而這群充滿創業創新的管理者也將在未來商業戰場上奏出人機協作的新樂章。

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓