登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

哈佛最新临床研究证实:大语言模型急诊诊断准确率超人类医生

哈佛大学医学院2026年5月发布的最新临床研究显示,针对1.7万份真实急诊病例的盲测中,一款经过医疗数据专项微调的大语言模型诊断准确率较急诊在岗医生高出12.2个百分点,在罕见病识别、多症状复合病例分析上表现优势尤为明显,该研究为AI辅助诊疗的落地应用提供了关键临床数据支撑。

全球范围内急诊室过载、医生接诊压力过大早已是医疗体系的共性难题,仅美国每年就有超过1.3亿人次急诊就诊,因医生疲劳、信息遗漏导致的误诊率长期维持在10%-15%区间,每年直接造成的额外死亡人数超过2.5万。此次哈佛研究的核心目标,正是验证大语言模型能否成为一线急诊团队的有效辅助工具。

该研究共纳入了美国12家三甲医院2022-2025年的1.7万份真实急诊病例,在剔除涉及隐私的个人信息后,分别交由不同年资的急诊医生团队和多款主流大语言模型同步开展盲测,诊断结果以后续住院确诊、病理检测结果作为唯一判定的黄金标准。

最终测试数据显示,经过千万级医疗文献、临床病例微调的GPT-4o医疗专项版本准确率达到92.3%,显著高于参与测试的急诊医生平均80.1%的准确率,其中在占比约8%的罕见病急诊病例中,AI的识别准确率更是超出人类医生27个百分点,仅在儿童非典型感染类病例中表现略低于经验丰富的高年资医生。

不同于人类医生的诊断高度依赖从业经验、接诊时的状态,微调后的医疗专项大语言模型可在毫秒级调用全球已公开的所有临床指南、罕见病病例报告,同时支持同步分析患者的CT影像、血液检测报告、既往病史等多模态数据,避免了医生因信息记忆不全、接诊量过大导致的疏漏。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创