医生不敌 AI:ChatGPT 诊断准确率高达 90%!
近年来,人工智能在医疗领域的应用不断扩大。最近,一项研究显示,OpenAI 开发的聊天机器人 ChatGPT-4在诊断准确性方面竟超越了医生,引发了广泛的讨论和关注。
该研究发表于《JAMA 网络开放》期刊,测试了50位医生在六个复杂病例上的表现。结果显示,使用 ChatGPT 辅助的医生平均得分为76%,而未使用该工具的医生仅为74%。令人震惊的是,ChatGPT 单独进行诊断时的准确率达到了90%。
研究者为了避免参与者或 AI 模型的先验知识,使用了真实的、未公开的病例历史。这些病例包括一些复杂的医疗状况,比如胆固醇栓塞,这是一种常常被忽视的稀有***。医生们在独立医疗专家的评分下,提供可能的诊断、排除替代方案并建议下一步的诊断步骤。尽管许多医生得到了 ChatGPT 的支持,但他们仍然难以匹敌 AI 的表现。
研究揭示了两个主要问题:首先,医生们往固守自己的初始诊断,尤其是在 ChatGPT 的建议与他们的看法相悖时。其次,很多医生没有充分利用 AI 工具的能力,往往只提出狭窄的问题,而未能全面分析病例历史。
专家们认为,现代 AI 工具通过语言模型对复杂病例进行细致分析,展现出了巨大的潜力。与早期计算机辅助诊断不同,现代 AI 工具并不试图模拟人类推理,而是通过处理和预测语言模式而表现出色。
尽管如此,专家们警告说,将 AI 融入医疗工作流程的过程不会一帆风顺。常见的挑战包括缺乏 AI 培训、医生对 AI 的抵触情绪以及有关伦理和法律的担忧。这些因素都可能阻碍 AI 作为 “医生延伸工具” 的潜力,影响其在提高诊断准确性方面的作用。
研究人员在分析聊天记录时发现,许多医生忽视了 ChatGPT 的建议。这种抵制心理部分源于他们对自身专业知识的过度自信,同时也因为缺乏对 AI 诊断能力的了解。
这项研究的结果强调了 AI 开发者与医疗专业人员之间合作的重要性,以增强信任和可用性。未来,AI 在医学中的角色可能会超越诊断,延伸至个性化治疗规划和病人管理等领域。尽管 AI 是一个非凡的工具,但如何有效地将其融入医疗实践中仍然需要大量的努力。