AI醫師來了?微軟AI診斷準確率飆85%「真人僅20%」:哪個AI最懂醫學?醫生也要失業了?
AI醫師來了?微軟AI診斷準確率飆85%「真人僅20%」:哪個AI最懂醫學?醫生也要失業了?

重點一 :微軟公布旗下AI診斷協調MAI-DxO於304例複雜病例中,正確診斷率達85.5%,遠超21位資深真人醫師的20%。

重點二 :該研究指出,MAI-DxO不僅診斷更精準,也能有效降低診斷成本,展現AI協助醫療決策的經濟效益。

重點三 :但MAI-DxO目前僅供研究用途,尚未獲臨床認證,未來將展開更多真實場域測試與安全驗證。

Microsoft AI團隊最新研究顯示,其開發的Microsoft AI Diagnostic Orchestrator (MAI-DxO,微軟AI診斷協調器)在醫學診斷領域取得突破性進展。

MAI-DxO以《新英格蘭醫學雜誌》(簡稱NEJM)每週發布的真實病例記錄為基準, 其正確診斷率高達85.5%,遠遠超越由美國與英國21位臨床經驗5至20年的資深醫師組成的對照組,後者平均僅達20%。 此一成果不僅展現AI在面對醫療難題時的精準度,也突顯成為臨床決策輔助工具的潛力。

採用真實病例!讓AI按照真實情境問診

過去AI醫療系統多以美國醫師執照考試(USMLE)等選擇題作為評測標準,但這類題型偏重記憶力,難以反映臨床推理與決策能力。微軟AI團隊認為,AI若要真正幫助醫療現場,必須具備逐步分析與決策能力。

因此,團隊開發出「序列診斷基準」(Sequential Diagnosis Benchmark, SD Bench),利用NEJM發表的304個複雜病例,讓AI或醫師從初步病徵出發,逐步詢問、選擇檢查並整合新資訊,最終給出診斷。 同時,AI模型的每一次檢查都要設定虛擬成本,模擬真實醫療資源消耗,讓評估同時考量診斷準確率與成本效益。

微軟團隊據此方式測試了多款生成式AI模型,包括GPT、Llama、Claude、Gemini、Grok與DeepSeek,並進一步開發MAI-DxO系統。 它的運作方式可以理解為,一個由多位醫師組成的虛擬團隊,AI 會根據病人的症狀,主動提出追問、選擇合適的檢查,並逐步推進診斷流程,最後給出診斷結果。

簡單來說, MAI-DxO 不只是單一 AI 系統,而是能整合多個不同 AI 模型,像醫師討論一樣協作解決問題,目標是幫助醫療人員更快、更準確、也更省錢地解決困難病例。

MAI-DxO .jpg
MAI-DxO 會像醫師一樣,根據病人症狀逐步詢問、安排檢查、分析結果,並在考量成本下推理出最合理的診斷。
圖/ 微軟

MAI-DxO正確率高達85%!單一模型o3正確率最高

研究結果顯示, MAI-DxO搭配OpenAI最新模型,在SD Bench上正確診斷率高達85.5%,而21位美國與英國臨床經驗5至20年的醫師,平均僅達20%。

圖表右下方有一個紅十字,標示為「Physicians (Overall)」,即為人類醫師團隊的20%正確診斷率的對照組,成本約為 $3,000 美元。

Pareto-Chart-v3-1.jpg
依照微軟研究結果,MAI-DxO不但正確診斷率高,在各個成本區間的表現也遠比單一模型更好。
圖/ 微軟

X軸:平均診斷檢查成本(美元)
Y軸 :診斷準確率(%)
紫色線條 :描繪MAI-DxO在不同設定下的表現(即在不同成本約束下的準確率變化)
紅色叉號 :21位臨床醫師的平均表現

令人驚訝的是, 單一模型的表現,除了成本較低的 GPT 3.5 Turbo 外,幾乎所有 AI 模型和系統都在診斷準確率上超越了人類醫師基準。 尤其 MAI-DxO 系統,即使是0成本,其準確率和成本效益也比人類醫師的平均表現更高。

至於各家語言模型的表現, 可看到OpenAI旗下的o3、o4 mini,以及Anthropic旗下的Claude 4 opus、Claude 4 sonnet為領先群,在70%正確診斷率的基礎,將平均診斷檢查成本控制在7000美元以下。其次表現較佳的則為Google旗下的Gemini 2.5 Pro,在逼近70%的正確診斷率上,成本在5000美元以下。

連醫師都要被AI取代了?微軟曝人類醫師「無可替代」關鍵

微軟研究強調,一般醫師多為全科或專科,難以同時兼顧廣泛與深入的專業領域。但AI可同時整合多專業知識,展現橫跨多領域的臨床推理能力,為醫療帶來全新可能。

微軟AI團隊認為,AI有潛力協助病患自主管理健康,也能成為醫師在複雜疾病診斷上的決策輔助工具,進一步提升醫療效率, 更重要的是,降低高昂的醫療成本。

研究強調,AI在診斷過程中不會一味要求所有檢查,而是能以較低成本達到高準確率,解決過度檢查導致的醫療浪費。美國目前醫療支出已近GDP的20%,其中高達四分之一被認為是無效支出,而AI有機會協助醫療體系更有效分配資源。

微軟表示,MAI-DxO目前僅為研究性質,尚未取得臨床應用認證,未來將持續與全球醫療機構合作,於真實臨床環境進行嚴格測試與驗證,並配合監管機構制定安全、可靠的應用標準。

微軟也強調「AI不會取代醫師」,而是成為醫師與病患的助手。臨床醫師在建立病患信任、處理不確定性等方面仍具不可取代的角色。

延伸閱讀:AI能代替心理諮商嗎?當ChatGPT變成「情緒樹洞」:絕不插話、永遠懂你,卻暗藏危機?

資料來源:微軟

往下滑看下一篇文章
不只給福利,更給好體驗!「有福企」如何用數位科技,重塑員工福利新樣貌
不只給福利,更給好體驗!「有福企」如何用數位科技,重塑員工福利新樣貌

疫情後,員工對生活品質與心理健康的關注快速提升,根據 WTW 員工健康福祉管理測評調查,95% 的企業已將提升員工心理健康列為未來三年的優先項目。與此同時,跨世代、跨領域的員工組成,讓福利設計面臨空前挑戰——如何兼顧不同需求,又能兼具彈性與效率,成為企業人資的共同痛點。

然而,多數企業的福利資源仍侷限於三節禮金或商品折扣,缺乏系統性規劃與數據追蹤;人資部門則常受限於人力與時間,難以從繁瑣行政中抽身,整合不同面向的資源投入,發展更具策略性的支持機制。當福利變成「有做卻感受不到」無法發揮綜效,企業經營與留才勢必受到影響。

有福企如何重塑企業、人資與員工的關係

現今VUCA時代與高齡化、少子化雙重壓力下,企業面對招募與留才的挑戰,神坊資訊觀察到許多國外標竿企業已將健康與保險納入企業福利場景,作為選才與留才策略的一環;反觀台灣,受惠於健保制度完備,福利規劃多集中在三節禮金、消費折扣等補助形式,對員工的實際支持面向存在限制。於是,神坊資訊於 2023 年推出「有福企®」目標是以數位平台翻轉福利設計的既有邏輯,於平台中整合員工保障、健康、特約商店等全方位福利。同樣觀察到此趨勢的國泰金控則是搶先合作導入「有福企®」作為其員工福利整合平台。

「台灣企業對健康支持的概念還不夠完整,我們希望透過這個平台,讓福利變得有感、有用。」神坊資訊人資互動科技部總監劉容先表示。神坊資訊也透過與國泰金控合作的經驗累積,逐步完善「有福企®」並發展出一套可供跨產業場景使用的數位福利解方,進而推廣至更廣泛的企業市場。

平台設計上採 B2B2E 模式,串連企業、HR、員工與供應商四方角色,透過模組化設計、後台管理與數據追蹤功能,整合企業福利管理的各式需求,包括福利點數發放、EAP 協助方案導入、員工活動、問卷調查等。HR 不再受限於繁瑣行政流程,可更專注在策略規劃與成效評估,提升部門能見度與角色價值。

「我們處理的是複雜邏輯,但使用者介面必須簡潔、直觀、可快速上手。」技術總監張朝傑指出,團隊以「低延遲、高延展」為核心開發原則,打造出一套不需改動既有制度、即可快速部署與彈性擴充的架構,協助企業大幅提升福利系統的管理效率與執行彈性。

3F0A3993_內文.JPG
神坊資訊人資互動科技部技術總監張朝傑、總監劉容先
圖/ 數位時代

以人為本的福利方案,讓選擇權回到員工手中

「有福企®」的數位架構為 HR 減輕負擔,也為員工創造更多參與可能。劉容先指出,許多企業過往福利資源分配方式固定,預算一旦編列,就難以因人調整。「像是育兒津貼,對單身員工毫無意義。我們希望透過彈性的功能,讓企業可以用相同的預算,給每位員工真正需要的福利與照顧。」

因此,「有福企®」進一步將福利核心從「消費支持」拓展為「生活支持」。平台整合心理健康、職涯發展、法律諮詢、財務建議等 EAP 員工協助服務,並透過數位介面降低使用門檻,讓員工能在真正需要的時刻被接住。劉容先分享,一位企業 HR 曾回饋,有員工在家庭遭遇變故時,透過平台獲得諮商支持,才得以平穩度過,「這就是我們做這件事的價值」。

在彈性福利資源上,「有福企®」除了提供特約優惠包括健康保障、運動課程、舒壓按摩等,更整合神坊資訊旗下相關服務,包括「小樹點」點數系統(註1),以及小樹生活圈的多元兌點通路。企業可將固定補助預算轉為數位點數,由員工依個人喜好自由兌換票券與宅配商品等福利內容,還可跨平台線上購物。透過多元化的福利內容,滿足不同世代與職能需求。截至目前,神坊資訊年發小樹點量已突破 10 億,平台累積近千家特約品牌與上萬項宅配商品。

為提升員工的互動參與率,平台未來也計畫推出活動報名簽到、獎勵發放、會議室跟按摩等服務預約模組,降低 HR 執行負擔、協助掌握使用數據,據此優化福利設計與預算配置,確保每一筆支出都能發揮效果。

3F0A4036-1.jpg
數位員工福利管理平台「有福企®」提供多元福利內容,給員工更全面的生活支持
圖/ 數位時代

人才永續最佳解,用數位工具助幸福職場落地

面對時代變遷與工作價值觀轉變,「留才」成為企業最迫切的挑戰。劉容先認為,「當企業內部的組成越來越多元,不同年齡、職能、生活階段,都對福利有不同期待。有福企希望透過點數與模組的彈性設計,幫助企業更有策略地照顧人才。」

張朝傑也表示,平台採用模組化架構,企業可依需求彈性啟用功能,創建企業福利的 SaaS 訂閱模式,透過這種方式讓中小企業得以逐步搭建屬於自己的福利體系。未來亦將導入 MCP 整合 AI 相關技術,提升互動效率與智慧化應用。

「有福企®」的推出,正是企業落實人本精神的實際展現——將對身心健康的重視、人本關懷的思維,轉化為具體可行的數位福利系統。國泰金控與神坊資訊的合作,也體現了其在員工福利資源投入上,以人為本的全人關懷。神坊資訊亦以「共好」為核心精神,如同劉容先所說:「因為我們內部也是用這樣的方式合作,唯有如此,平台與文化,才有機會真正走進每個企業的日常。」

註1:「小樹點」點數系統,分為小樹點(生活)與小樹點(信用卡)兩種點數類型,本文所述為小樹點(生活)

立即前往「有福企官網」,了解更多數位員工福利解決方案!

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
電商終局戰
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓