平安医疗大模型3.5登顶全球医疗AI评测超越OpenAI等巨头

AI创作导航管理员 LV4 资深连续登录7天萌新

2 个月前

风向

193

中国平安旗下平安科技研发的医疗大模型3.5，近日在OpenAI推出的全球权威医疗AI评测子集HealthBench Hard中，以57.27分的成绩登顶全球第一，超越Meta、OpenAI等国际AI巨头。该评测由来自60个国家的262名医生共同构建，包含5000组高仿真复杂临床对话，核心测试大模型的临床推理能力。

不同于多数医疗AI评测依赖结构化的公开病历数据，本次HealthBench Hard评测从出题阶段就贴合临床真实需求。评测团队联合全球60个国家的262名临床医生，整理出5000组覆盖疑难杂症、多症状交叉场景的高仿真医患对话，专门筛选出通用大模型容易出错的高难度考题，核心考察大模型在真实诊疗环节的逻辑推理与判断能力，结果认可度远高于普通行业测试。

OpenAI 人工智能医疗大模型平安科技

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

平安医疗大模型3.5登顶全球医疗AI评测超越OpenAI等巨头

最新文章

X社区 · 无限公约

二狗PPT

网传SpaceX展示AI手机原型马斯克公开辟谣称消息完全虚假

Meta跟进SpaceX模式布局云业务转售闲置AI算力股价涨10%

苹果Safari预览版上线MCP服务 AI智能体赋能前端开发调试

谷歌大幅扩容Gemini API免费额度轻量化模型吞吐量破百万级

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

平安医疗大模型3.5登顶全球医疗AI评测 超越OpenAI等巨头

最新文章

X社区 · 无限公约

二狗PPT

网传SpaceX展示AI手机原型 马斯克公开辟谣称消息完全虚假

Meta跟进SpaceX模式布局云业务 转售闲置AI算力股价涨10%

苹果Safari预览版上线MCP服务 AI智能体赋能前端开发调试

谷歌大幅扩容Gemini API免费额度 轻量化模型吞吐量破百万级

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

平安医疗大模型3.5登顶全球医疗AI评测超越OpenAI等巨头

网传SpaceX展示AI手机原型马斯克公开辟谣称消息完全虚假

Meta跟进SpaceX模式布局云业务转售闲置AI算力股价涨10%

谷歌大幅扩容Gemini API免费额度轻量化模型吞吐量破百万级