最新研究：生成式AI尚无法独立承担临床推理诊疗任务

AI创作导航管理员 LV4 资深连续登录7天萌新

1 个月前

风向

美国麻省总医院MESH孵化器团队最新发表于权威医学期刊《JAMA Network Open》的研究，针对当前主流生成式AI的临床推理能力展开了系统性测试。研究团队选取了包括ChatGPT、DeepSeek、Claude在内的21种主流大语言模型，通过29个真实临床病例模拟动态诊疗过程，结果显示当前生成式AI虽在最终诊断上有不错表现，但核心的鉴别诊断环节短板明显，尚不具备独立承担临床诊疗任务的能力。

这项研究没有采用静态考题测试AI的医疗能力，而是刻意贴近临床真实场景设计实验：研究人员选取29个已经得到确诊的典型临床病例，逐步向AI模型释放患者症状、实验室检查数据以及影像结果，完整还原医生接诊时逐步获取信息、逐步推理的动态过程。本次测试共覆盖21款主流大语言模型，囊括了ChatGPT、DeepSeek、Claude、Gemini、Grok等市场知名度最高的头部产品。

大语言模型生成式AI AI医疗临床推理

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

最新研究：生成式AI尚无法独立承担临床推理诊疗任务

最新文章

X社区 · 无限公约

Trajectory开源多LoRA并行训练栈训练吞吐量提升2.81倍

GitHub Copilot推出令牌制计费引发开发者群体广泛争议

Genesis AI推出Genesis World 1.0 破解机器人基础模型评估难题

Hermes Agent上线MCP工具搜索评测准确率较Opus 4最高涨74%

Oculus创始人跨界创业 Sesame推对话AI iOS公测主打边想边说

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

最新研究：生成式AI尚无法独立承担临床推理诊疗任务

最新文章

X社区 · 无限公约

Trajectory开源多LoRA并行训练栈 训练吞吐量提升2.81倍

GitHub Copilot推出令牌制计费 引发开发者群体广泛争议

Genesis AI推出Genesis World 1.0 破解机器人基础模型评估难题

Hermes Agent上线MCP工具搜索 评测准确率较Opus 4最高涨74%

Oculus创始人跨界创业 Sesame推对话AI iOS公测主打边想边说

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

标签

探索分类

帮助与支持

联系我们

安装网站应用

Trajectory开源多LoRA并行训练栈训练吞吐量提升2.81倍

GitHub Copilot推出令牌制计费引发开发者群体广泛争议

Hermes Agent上线MCP工具搜索评测准确率较Opus 4最高涨74%