微軟推出 MAI Diagnostic Orchestrator 踏向醫療超級智慧
July 2, 2024
微軟近期推出了 MAI Diagnostic Orchestrator (MAI‑DxO) —— 這是一套劃時代的人工智慧系統,在醫學領域最棘手的病例中,其診斷準確率是資深醫師的四倍。這代表微軟邁向所謂「醫療超級智慧」的重要進展。
什麼是 MAI‑DxO
MAI‑DxO 是一個模擬虛擬醫療團隊的 AI 協作架構。由多個專業 AI 代理組成,分別負責提出假設、決策診斷檢查、成本監控及最終診斷。這些代理會互相辯論、修正並協作,模擬臨床推理過程。
主要特色
- 連鎖式辯論推理,各代理彼此挑戰與優化結果。
- 模型無關架構,可兼容 OpenAI o3、Claude、Gemini、Grok、Llama 及 DeepSeek。
- 成本意識決策,避免不必要的檢查並提升效率。
如何進行評估
微軟建立了 Sequential Diagnosis Benchmark (SDBench),這是一套來自 新英格蘭醫學雜誌 的 304 例極高難度臨床案例,旨在模擬真實世界的診斷挑戰。
評估過程包括:
- 代理反覆提問、安排檢查並修正診斷。
- 模擬檢查成本,以評估經濟效益。
與醫師比較
指標 | MAI‑DxO + OpenAI o3 | 資深醫師(5–20 年經驗) |
---|---|---|
診斷準確率 | 85.5% | 20% |
單病例平均成本 | $2,397 | $2,963 |
MAI‑DxO 在準確率上明顯超越資深醫師,同時也讓成本降低約 20%。
為什麼這很重要
- 準確和效率並重: MAI‑DxO 解決了醫療過度治療與複雜疾病漏診的矛盾。
- 專家知識普及化: 把專家級決策支援帶往資源有限地區。
- 透明性: 推理過程逐步可審核、可解釋。
前方挑戰
- 臨床驗證: 還需要在醫師使用所有工具並具團隊協作的真實場域中測試。
- 法規批准: 臨床應用前需解決安全性、偏見與隱私等疑慮。
下一步計畫
- 微軟計畫將 MAI‑DxO 整合進 Bing 與 Copilot,這些平台早已處理數以百萬計健康查詢。
- 與醫院(如 Beth Israel Deaconess)合作,在臨床工作流程中實測 MAI‑DxO。
- 研究人員相信,在 5 到 10 年內,接近零失誤的診斷可能成真。
最後想法
MAI‑DxO 是 AI 系統能如醫學專家般推理的重要一步。其在高度複雜基準上的表現,展現多代理人 AI 系統改變診斷領域的潛力——但在正式進入臨床前,仍有不少工作要做。