蚂蚁医疗大模型拿下MedBench测评“双料”冠军_健康生活

蚂蚁医疗大模型拿下MedBench测评“双料”冠军

健康生活 2025-03-13 user3534

　　近日，记者发现，国内权威医疗大模型评测平台MedBench在官网更新了榜单。多个医疗AI产品及研究团队入榜，其中蚂蚁AI健康管家团队研发的蚂蚁医疗大模型以评测榜单97.5、自测榜单98.2的高分再度夺得双料冠军。

　　MedBench测评结果显示，蚂蚁医疗大模型在医学知识问答、医学语言生成、复杂医学推理三类单项中位居第一，同时，在医学语言理解和医疗安全和伦理等纬度也有突出表现。在此前的榜单综合测评中，蚂蚁医疗大模型也长期位居综合榜第一。

　　医疗行业是复杂度较高的领域，医疗大模型实时评估体系对应用稳定落地尤为关键。MedBench为中文医疗大语言模型提供了一个公平、透明且科学的评估标准，蚂蚁医疗大模型登顶榜单，意味着其当前的技术能力转化为医疗AI产品具备专业度和领先性。

　　据了解，蚂蚁医疗健康团队近期完成了基于强化学习的新一代医疗推理模型研发。AI引擎升级后，该垂直行业大模型不仅具备“医学思维”推理能力，还能完成“图、文、音视频等”多模态交互。基于此，蚂蚁医疗大模型添加百亿级中英文图文、千亿级医疗文本语料及千万级高质量医疗知识图谱进行专业知识训练，经过医患***、药厂等真实场景问答的多任务微调，以及数百个专业医学团队、医生标注数据的强化学习。以医学报告、药品、毛发等图像识别为例，目前该模型准确率达90%以上。

　　在安全性上，蚂蚁医疗大模型集合了蚂蚁集团在隐私安全风控方面的技术优势，并在数据使用的去标识化方面遵循安全隐私标准。从去年7月推出以来，还面向行业开放了配套的“可信一体机+可信云”解决方案，保障数据隐私与算力效率，为医院、医疗机构提供可靠的本地部署与数据保护支持。

The End

免责声明：本文内容来源于第三方或整理自互联网，本站仅提供展示，不拥有所有权，不代表本站观点立场，也不构成任何其他建议，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容,不承担相关法律责任。如发现本站文章、图片等内容有涉及版权/违法违规或其他不适合的内容，请及时联系我们进行处理。

蚂蚁医疗大模型拿下MedBench测评“双料”冠军

分类导航

最新文章

本栏文章

随机文章

友情链接

蚂蚁医疗大模型拿下MedBench测评“双料”冠军

相关阅读

分类导航

最新文章

本栏文章

随机文章

友情链接