你上一次做重大決策之前,有沒有人幫你認真挑過毛病?
2026 年 4 月底,來自哈佛醫學院與波士頓貝斯以色列女執事醫療中心,並發表在頂級學術期刊《Science》的研究〈大型語言模型在醫師臨床推理任務上的表現〉(Performance of a large language model on the reasoning tasks of a physician),在醫療與 AI 圈引發廣泛討論。研究並帶出兩個值得關注的發現。
發現一:在資訊最少的關頭,AI 分診準確率超越主治醫師
研究團隊以 76 名真實急診病患的電子病歷為素材,讓 OpenAI 的 o1-preview 模型(研究同時也測試了 GPT-4o)與兩位內科主治醫師分別做出診斷,再由另外兩位對身份不知情的主治醫師進行盲測評分。
評估分為三個階段,對應病人在急診的真實動線:入院時的初步分診、與醫師的首次接觸、以及入院進入普通病房或重症監護室。每個階段,AI 與醫師只能看到「當下這一刻」可取得的病歷資訊,據此給出可能診斷與下一步處置建議。
結果是:在每一個階段,o1-preview 的表現都與兩位主治醫師相當或略勝一籌。差距最明顯的是第一階段——初步分診,也就是病人剛進急診、資訊最少、判斷壓力最高的瞬間。在這個階段,o1-preview 給出正確或接近正確診斷的比例達到 67%,兩位人類醫師則分別為 55% 與 50%。
研究團隊另設計了一組以《新英格蘭醫學期刊》刊載的麻州總醫院複雜病例為基準的測試,o1-preview 在罕見疾病與複雜病例的診斷上同樣表現亮眼。
不過研究團隊同時強調,這並不代表 AI 已準備好取代醫師。
發現二:研究團隊真正看好的,是 AI 擔任「第二意見」
研究共同作者、哈佛醫學院助理教授兼貝斯以色列女執事醫療中心醫師 Adam Rodman 指出,AI 在臨床的最佳用例之一,是擔任第二意見(second opinion)——當醫師已經有判斷,再請 AI 從另一個角度回頭檢視。
「醫師向同事尋求第二意見,通常都能改善照護品質。」
Rodman 引述 2025 年一份 Elsevier 研究指出,已有 20% 的臨床醫師會諮詢大型語言模型取得第二意見,這個比例至今應該還在成長。
這個用法翻轉了一般人對 AI 在醫療角色的想像:AI 的價值,不是要取代你判斷,而是當你已經有判斷之後,幫你檢查那個判斷哪裡可能站不住腳。
為什麼連主治醫師也需要第二意見?
人類的大腦在時間壓力高、資訊不完整時,會自動走捷徑——抓住第一個合理假設、忽略不利證據、用熟悉模式套陌生狀況。心理學稱之為「錨定效應」與「確認偏誤」。
不只是醫師,同樣的偏誤也可能出現在你身上。比方合約談判的最後一輪、關鍵職缺的最終面試、預算核准前的最後確認。當你以為自己已經想清楚,可能只是大腦已經停止挑戰自己。
哈佛研究在醫療場景找到的解方,同樣適用於任何高壓決策。
複製這組提示詞,在決策前讓 AI 挑戰你的推理
以下提示詞出自 《The Neuron》,適用於任何 AI 工具,如 Claude、Gemini 或 ChatGPT。把括號內容換成你的實際狀況,貼入對話框即可。
英文版提示詞
I've concluded [YOUR DECISION] based on the following reasoning: [YOUR REASONING].
Before I commit, I want a structured second opinion. Please:
1. Identify the strongest argument against my conclusion.
2. Generate three alternative hypotheses I may have missed.
3. List the specific evidence or scenarios that would shift your assessment in either direction.
4. Flag any assumptions in my reasoning that look load-bearing but aren't actually supported.
Be direct. I'm looking for the version of this analysis I'd get from a sharp colleague who isn't trying to spare my feelings.
中文版提示詞
我的結論是:[你的決策],推理依據如下:[你的推理與論據]。
在我正式拍板之前,我需要一份結構化的第二意見。請:
1. 指出反對我結論的最有力論點。
2. 提出三個我可能遺漏的替代假設。
3. 列出哪些具體證據或情境,會讓你的評估朝任一方向改變。
4. 標記我的推理中那些看似關鍵、但實際上缺乏支撐的前提假設。
請直接說。我要的是一位不會顧及我面子的聰明同事,會給我的那種分析。
在把問題貼給 AI 之前,你必須先把自己的結論與論據寫下來。這個動作本身,將有助於讓自己意識到哪些地方其實說不清楚、哪些前提其實沒有根據。AI 接著做的,是從另一個角度重新審視你的推理,找出最強的反駁、你可能忽略的替代假設、以及那些看起來穩固但其實沒有支撐的前提。
哈佛研究揭示的,是 AI 在資訊最少、壓力最大的時刻依然能維持判斷品質,而這正是人類最容易出錯的地方。這組提示詞的價值,在於它能幫你抓出思考時的盲點,讓你做出決策之前,能多看見一次自己沒看到的地方。
下次做決策前,不妨先將你的決策、推理與論據都先餵給 AI,讓它擔任你的決策輔佐官。
本文授權轉載自FC未來商務
