AI醫師來了?微軟AI診斷準確率飆85%「真人僅20%」:哪個AI最懂醫學?醫生也要失業了?
AI醫師來了?微軟AI診斷準確率飆85%「真人僅20%」:哪個AI最懂醫學?醫生也要失業了?

重點一 :微軟公布旗下AI診斷協調MAI-DxO於304例複雜病例中,正確診斷率達85.5%,遠超21位資深真人醫師的20%。

重點二 :該研究指出,MAI-DxO不僅診斷更精準,也能有效降低診斷成本,展現AI協助醫療決策的經濟效益。

重點三 :但MAI-DxO目前僅供研究用途,尚未獲臨床認證,未來將展開更多真實場域測試與安全驗證。

Microsoft AI團隊最新研究顯示,其開發的Microsoft AI Diagnostic Orchestrator (MAI-DxO,微軟AI診斷協調器)在醫學診斷領域取得突破性進展。

MAI-DxO以《新英格蘭醫學雜誌》(簡稱NEJM)每週發布的真實病例記錄為基準, 其正確診斷率高達85.5%,遠遠超越由美國與英國21位臨床經驗5至20年的資深醫師組成的對照組,後者平均僅達20%。 此一成果不僅展現AI在面對醫療難題時的精準度,也突顯成為臨床決策輔助工具的潛力。

採用真實病例!讓AI按照真實情境問診

過去AI醫療系統多以美國醫師執照考試(USMLE)等選擇題作為評測標準,但這類題型偏重記憶力,難以反映臨床推理與決策能力。微軟AI團隊認為,AI若要真正幫助醫療現場,必須具備逐步分析與決策能力。

因此,團隊開發出「序列診斷基準」(Sequential Diagnosis Benchmark, SD Bench),利用NEJM發表的304個複雜病例,讓AI或醫師從初步病徵出發,逐步詢問、選擇檢查並整合新資訊,最終給出診斷。 同時,AI模型的每一次檢查都要設定虛擬成本,模擬真實醫療資源消耗,讓評估同時考量診斷準確率與成本效益。

微軟團隊據此方式測試了多款生成式AI模型,包括GPT、Llama、Claude、Gemini、Grok與DeepSeek,並進一步開發MAI-DxO系統。 它的運作方式可以理解為,一個由多位醫師組成的虛擬團隊,AI 會根據病人的症狀,主動提出追問、選擇合適的檢查,並逐步推進診斷流程,最後給出診斷結果。

簡單來說, MAI-DxO 不只是單一 AI 系統,而是能整合多個不同 AI 模型,像醫師討論一樣協作解決問題,目標是幫助醫療人員更快、更準確、也更省錢地解決困難病例。

MAI-DxO .jpg
MAI-DxO 會像醫師一樣,根據病人症狀逐步詢問、安排檢查、分析結果,並在考量成本下推理出最合理的診斷。
圖/ 微軟

MAI-DxO正確率高達85%!單一模型o3正確率最高

研究結果顯示, MAI-DxO搭配OpenAI最新模型,在SD Bench上正確診斷率高達85.5%,而21位美國與英國臨床經驗5至20年的醫師,平均僅達20%。

圖表右下方有一個紅十字,標示為「Physicians (Overall)」,即為人類醫師團隊的20%正確診斷率的對照組,成本約為 $3,000 美元。

Pareto-Chart-v3-1.jpg
依照微軟研究結果,MAI-DxO不但正確診斷率高,在各個成本區間的表現也遠比單一模型更好。
圖/ 微軟

X軸:平均診斷檢查成本(美元)
Y軸 :診斷準確率(%)
紫色線條 :描繪MAI-DxO在不同設定下的表現(即在不同成本約束下的準確率變化)
紅色叉號 :21位臨床醫師的平均表現

令人驚訝的是, 單一模型的表現,除了成本較低的 GPT 3.5 Turbo 外,幾乎所有 AI 模型和系統都在診斷準確率上超越了人類醫師基準。 尤其 MAI-DxO 系統,即使是0成本,其準確率和成本效益也比人類醫師的平均表現更高。

至於各家語言模型的表現, 可看到OpenAI旗下的o3、o4 mini,以及Anthropic旗下的Claude 4 opus、Claude 4 sonnet為領先群,在70%正確診斷率的基礎,將平均診斷檢查成本控制在7000美元以下。其次表現較佳的則為Google旗下的Gemini 2.5 Pro,在逼近70%的正確診斷率上,成本在5000美元以下。

連醫師都要被AI取代了?微軟曝人類醫師「無可替代」關鍵

微軟研究強調,一般醫師多為全科或專科,難以同時兼顧廣泛與深入的專業領域。但AI可同時整合多專業知識,展現橫跨多領域的臨床推理能力,為醫療帶來全新可能。

微軟AI團隊認為,AI有潛力協助病患自主管理健康,也能成為醫師在複雜疾病診斷上的決策輔助工具,進一步提升醫療效率, 更重要的是,降低高昂的醫療成本。

研究強調,AI在診斷過程中不會一味要求所有檢查,而是能以較低成本達到高準確率,解決過度檢查導致的醫療浪費。美國目前醫療支出已近GDP的20%,其中高達四分之一被認為是無效支出,而AI有機會協助醫療體系更有效分配資源。

微軟表示,MAI-DxO目前僅為研究性質,尚未取得臨床應用認證,未來將持續與全球醫療機構合作,於真實臨床環境進行嚴格測試與驗證,並配合監管機構制定安全、可靠的應用標準。

微軟也強調「AI不會取代醫師」,而是成為醫師與病患的助手。臨床醫師在建立病患信任、處理不確定性等方面仍具不可取代的角色。

延伸閱讀:AI能代替心理諮商嗎?當ChatGPT變成「情緒樹洞」:絕不插話、永遠懂你,卻暗藏危機?

資料來源:微軟

往下滑看下一篇文章
科技創新守護海洋!犀牛盾以循環創新思維破解塑膠危機、賦能永續未來
科技創新守護海洋!犀牛盾以循環創新思維破解塑膠危機、賦能永續未來

全球每年約生產4億噸塑膠垃圾,只有不到10%有被回收,其中約有1100萬至1400萬噸最終流入海洋。在十分有限的回收量中,約 8 成來自相對單純、流程完整的寶特瓶回收;反觀,同樣是高頻消費品的手機配件,回收率卻不到 1%。這個現象,對長期從事材料研究的犀牛盾共同創辦人暨執行長王靖夫來說,是他反思事業選擇的開端,也是突破的轉捩點。

「手機殼產業其實是塑膠產業的縮影!」他在2025 亞馬遜港都創新日的專題演講上直言。手機殼本質上類似一種快時尚商品,每年有超過十億個手機殼被製造,但產業並未建立材料規範,多數產品混用多種複合塑膠、填料與添加物,既難拆解、也沒有回收機制。結果是,一個重量相當於超過二十個塑膠袋的手機殼,在生命周期終點只能被視為垃圾。

王靖夫指出,連結構複雜的資訊科技產品,回收率都能達 45%,但手機殼明明是最簡單、最應該回收的產品,為什麼無法有效回收?這個命題讓他意識到,與其只做手機殼,不如正面處理塑膠問題本身,從材料設計、製程到後端回收再生,開創循環之道。

犀牛盾共同創辦人暨執行長王靖夫於2025 亞馬遜港都創新日分享犀牛盾如何回應塑膠挑戰、開創循環模式。
犀牛盾共同創辦人暨執行長王靖夫於2025 亞馬遜港都創新日分享犀牛盾如何回應塑膠挑戰、開創循環模式。
圖/ Amazon Web Services 提供

以材料工程打造手機殼的循環力

若塑膠要進入循環體系,前提是「材料必須足夠單純」。王靖夫很快意識到,問題不在回收端,關鍵在最開始的設計端。多數手機殼由多款不同塑膠、橡膠件甚至金屬等複合材料組成,無法被經濟化拆解,也難以透過現有流程再製。為此,犀牛盾在2017年起重新整理產品線,希望借鑑寶特瓶成功循環的經驗,擬定出手機殼應有的設計框架。

新框架以「單 1 材料、0 廢棄、100% 循環設計」為核心,犀牛盾從材料工程出發,建立一套循環路徑,包括:回收再生、溯源管控、材料配方、結構設計、循環製程、減速包裝與逆物流鏈等,使產品從生產到回收的每一階段,皆與核心精神環環相扣。

王靖夫表示,努力也終於有了成果。今年,第一批以回收手機殼再製的新產品已正式投入生產,犀牛盾 CircularNext 回收再生手機殼以舊殼打碎、造粒後再製成型;且經內部測試顯示,材料還可反覆再生六次以上仍維持耐用強度,產品生命週期大大突破「一次性」。

另外,今年犀牛盾也推出的新一代的氣墊結構手機殼 AirX,同樣遵守單一材料規範,透過結構設計打造兼具韌性、耐用、便於回收的產品。由此可見,產品要做到高機能與循環利用,並不一定矛盾。

犀牛盾從材料學出發,實現全線手機殼產品皆採「單 1 材料」與模組化設計,大幅提升回收循環再生效率。
犀牛盾從材料學出發,實現全線手機殼產品皆採「單 1 材料」與模組化設計,大幅提升回收循環再生效率。
圖/ 犀牛盾

海上掃地機器人將出海試營運

在實現可循環材料的技術後,王靖夫很快意識到另一項挑戰其實更在上游——若塑膠源源不斷流入環境,再強的循環體系也只是疲於追趕。因此,三年前,犀牛盾再提出一個更艱鉅的任務:「能不能做到塑膠負排放?」也就是讓公司不僅不再製造新的塑膠,還能把已散落在環境中的塑膠撿回來、重新變成可用原料。

這個想法也促成犀牛盾啟動「淨海計畫」。身為材料學博士,王靖夫將塑膠問題拆為三類:已經流落環境、難以回收的「考古塑膠(Legacy Plastic)」;仍在使用、若無管理便會成為下一批廢棄物的「現在塑膠(Modern Plastic)」;以及未來希望能在自然環境中真正分解的「未來塑膠(Future Plastic)」。若要走向負排放,就必須對三個路徑同時提出技術與管理解方。

其中最棘手的是考古塑膠,尤其是海洋垃圾。傳統淨灘方式高度仰賴人力,成本極高,且難以形成可規模化的商業模式,因此無法提供可持續的海廢來源作為製造原料。為突破這項瓶頸,犀牛盾決定自己「下海」撿垃圾,發展PoC(概念驗證)項目,打造以 AI 作為核心的淨海系統。

王靖夫形容,就像是一台「海上的掃地機器人」。結合巡海無人機進行影像辨識、太陽能驅動的母船作為能源與運算平台,再由輕量子船前往定位點進行海廢收集:目的就是提升撿拾效率,同時也累積資料,為未來的規模化建立雛形。

從海洋到河川,探索更多可能

淨海計畫的下一步,不只是把「海上的掃地機器人」做出來,王靖夫說:「目標是在全球各地複製擴張規模化、讓撿起的回收塑膠真正的再生利用。」也就是說,海上平台終究要從單點示範,走向可標準化、在不同海域與國家部署的技術模組,持續穩定地把海廢帶回經濟體。

犀牛盾CircularBlue™海洋廢棄物過濾平台初號機將出海試營運,盼解決沿岸海洋廢棄物問題。
犀牛盾CircularBlue™海洋廢棄物過濾平台初號機將出海試營運,盼解決沿岸海洋廢棄物問題。
圖/ 犀牛盾

他進一步指出,「其實這套系統不限於海洋,也可以在河川上。畢竟很多海洋垃圾是從河流來的。」未來若能推進到河川與港灣,將塑膠在進海之前就攔截下來,不僅有助於減少海洋污染,回收後的材料也更乾淨、更適合再生,步步朝向終極願景——隨著時間推進,海中垃圾愈來愈少,被撿起、回收後再生的塑膠會越來越多。

「我們已經證明兩件事的可行性:一端是產品的循環設計,一端是 AI 賦能海廢清理的可能性。」王靖夫笑說,塑膠管理命題不只為自己和公司找到新的長期目標,也讓他順利度過中年危機。「選擇改變,留給下一代更好的未來。」他相信,即便是一家做手機殼的公司,也能創造超乎想像的正向改變。

AWS 2025 亞馬遜港都創新日,集結產業先行者分享創新經驗。
AWS 2025 亞馬遜港都創新日,集結產業先行者分享創新經驗。
圖/ Amazon Web Services 提供

登入數位時代會員

開啟專屬自己的主題內容,

每日推播重點文章

閱讀會員專屬文章

請先登入數位時代會員

看更多獨享內容

請先登入數位時代會員

開啟收藏文章功能,

請先登入數位時代會員

開啟訂閱文章分類功能,

請先登入數位時代會員

我還不是會員, 註冊去!
追蹤我們
進擊的機器人
© 2025 Business Next Media Corp. All Rights Reserved. 本網站內容未經允許,不得轉載。
106 台北市大安區光復南路102號9樓