登录体验完整功能(收藏、点赞、评论等) — 已累计有 8635 人加入

让AI触手可及,让应用激发潜能

平安医疗大模型3.5登顶全球医疗AI评测 超越OpenAI等巨头

中国平安旗下平安科技研发的医疗大模型3.5,近日在OpenAI推出的全球权威医疗AI评测子集HealthBench Hard中,以57.27分的成绩登顶全球第一,超越Meta、OpenAI等国际AI巨头。该评测由来自60个国家的262名医生共同构建,包含5000组高仿真复杂临床对话,核心测试大模型的临床推理能力。

不同于多数医疗AI评测依赖结构化的公开病历数据,本次HealthBench Hard评测从出题阶段就贴合临床真实需求。评测团队联合全球60个国家的262名临床医生,整理出5000组覆盖疑难杂症、多症状交叉场景的高仿真医患对话,专门筛选出通用大模型容易出错的高难度考题,核心考察大模型在真实诊疗环节的逻辑推理与判断能力,结果认可度远高于普通行业测试。

本次夺冠的平安医疗大模型3.5,走出了一条和通用大模型微调不同的研发路径。模型核心能力已经从基础的健康咨询、信息获取,延伸至复杂病种辅助决策、多学科协同诊疗环节,突破了传统医疗AI的应用边界。平安科技在研发过程中始终锚定真实临床场景的需求,而非一味追求通用大模型的参数规模,这种贴合行业痛点的研发思路,也让模型的临床可用性、判断准确率领先于同行。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯
AI小创