重點一:Copilot Cowork 能在 Microsoft 365 中自主追蹤並持續推進複雜任務,不需使用者全程盯著。
重點二:Researcher 新增 Critique 功能:一個模型寫報告、另一個專門挑毛病查來源。
重點三:Council 功能讓 Claude 與 GPT 各自生一份報告,再由第三個裁判模型比對兩者的共識與分歧,幫使用者發現盲點。
微軟於 2026 年 3 月 30 日宣布,Copilot Cowork 正式透過 Frontier 早期體驗計畫上線,同步推出 Researcher 的多模型智慧架構,讓 Microsoft 365 Copilot 具備處理長時程、多步驟企業任務的能力。
Copilot Cowork:為長跑型工作設計的 AI 同事
Copilot Cowork 的定位是能在 Microsoft 365 生態系中承接「長時間執行、多步驟」工作流程的智慧代理。
與一問一答式的 Copilot Chat 不同,Cowork 會主動追蹤任務進度、提供下一步建議,讓使用者可以把複雜專案交給它持續推進,自己不必全程守著。
目前 Copilot Cowork 透過 Frontier 計畫開放早期使用,Frontier 是微軟針對企業客戶推出的前瞻功能搶先體驗管道。
Researcher 新增多模型架構:Critique 與 Council
同步升級的是 Microsoft 365 Copilot 深度研究代理 Researcher,這次引入了兩個由多模型協作驅動的新機制。
一、Critique(批判性審查)
Critique 將生成與評估分離,由兩個專門模型分工合作:一個負責深度探索與整合資訊,另一個則扮演審查者角色,驗證論點並強化報告品質。
審查維度涵蓋三項:來源可信度(是否引用具權威性、領域適切的資料)、報告完整性(是否涵蓋足夠廣度與深度)、以及嚴格的證據標準(每一項關鍵論點是否有明確引用支撐)。
在 DRACO 基準測試(橫跨 10 個領域、100 項複雜任務)中,Critique 相較單一模型做法提升了 7.0 分(標準誤差 ±1.90),與 Perplexity Deep Research 相比改善幅度達 13.88%,其中廣度與深度分析(+3.33 分)及報告呈現品質(+3.04 分)進步最為顯著。
二、Council(多方審議)
Council 則採平行策略:同時呼叫 Anthropic(Claude)與 OpenAI 模型各自獨立生成報告,再由專屬的裁判模型整合兩份結果,點出雙方的共識、分歧,以及各模型的獨特貢獻,提供使用者並排比較的視角。
當使用者在模型選擇器中選擇「Auto」時,Critique 為預設啟用體驗;Council 則需手動選擇。
這兩項功能同樣已在 Frontier 計畫中上線。
資料來源:Microsoft 365 Blog、Microsoft Tech Community
本文初稿為AI編撰,整理.編輯/ 李先泰
