微軟推出 MAI Diagnostic Orchestrator 踏向醫療超級智慧

July 2, 2024

微軟近期推出了 MAI Diagnostic Orchestrator (MAI‑DxO) —— 這是一套劃時代的人工智慧系統,在醫學領域最棘手的病例中,其診斷準確率是資深醫師的四倍。這代表微軟邁向所謂「醫療超級智慧」的重要進展。

閱讀微軟原始發表

什麼是 MAI‑DxO

MAI‑DxO 是一個模擬虛擬醫療團隊的 AI 協作架構。由多個專業 AI 代理組成,分別負責提出假設、決策診斷檢查、成本監控及最終診斷。這些代理會互相辯論、修正並協作,模擬臨床推理過程。

主要特色

  • 連鎖式辯論推理,各代理彼此挑戰與優化結果。
  • 模型無關架構,可兼容 OpenAI o3、Claude、Gemini、Grok、Llama 及 DeepSeek。
  • 成本意識決策,避免不必要的檢查並提升效率。

如何進行評估

微軟建立了 Sequential Diagnosis Benchmark (SDBench),這是一套來自 新英格蘭醫學雜誌304 例極高難度臨床案例,旨在模擬真實世界的診斷挑戰。

評估過程包括:

  • 代理反覆提問、安排檢查並修正診斷。
  • 模擬檢查成本,以評估經濟效益。

與醫師比較

指標MAI‑DxO + OpenAI o3資深醫師(5–20 年經驗)
診斷準確率85.5%20%
單病例平均成本$2,397$2,963

MAI‑DxO 在準確率上明顯超越資深醫師,同時也讓成本降低約 20%。

為什麼這很重要

  • 準確和效率並重: MAI‑DxO 解決了醫療過度治療與複雜疾病漏診的矛盾。
  • 專家知識普及化: 把專家級決策支援帶往資源有限地區。
  • 透明性: 推理過程逐步可審核、可解釋。

前方挑戰

  • 臨床驗證: 還需要在醫師使用所有工具並具團隊協作的真實場域中測試。
  • 法規批准: 臨床應用前需解決安全性、偏見與隱私等疑慮。

下一步計畫

  • 微軟計畫將 MAI‑DxO 整合進 Bing 與 Copilot,這些平台早已處理數以百萬計健康查詢。
  • 與醫院(如 Beth Israel Deaconess)合作,在臨床工作流程中實測 MAI‑DxO。
  • 研究人員相信,在 5 到 10 年內,接近零失誤的診斷可能成真。

最後想法

MAI‑DxO 是 AI 系統能如醫學專家般推理的重要一步。其在高度複雜基準上的表現,展現多代理人 AI 系統改變診斷領域的潛力——但在正式進入臨床前,仍有不少工作要做。

開始使用

上傳您的 X-ray 影像並獲取解讀。

立即上傳 →

免責聲明: X-ray Interpreter 的 AI 生成結果僅供參考,不能替代專業醫療建議。請務必諮詢醫療專業人士以獲取準確診斷與治療。

訂閱 RadAI Slice

每週將放射線 AI 的最新新聞、研究與 FDA 核准資訊送到您的收件匣。