2026年6月,百川智能联合清华大学研究团队正式发布新一代医疗增强大模型Baichuan-M4。该模型在权威医疗评测HealthBench及Hard、Professional两个子榜单中全部夺冠,医疗领域专业性能超越GPT-5.5,核心突破为模拟真人医生的主动问诊交互模式,为AI在临床辅助决策等医疗垂直场景落地提供了新的技术路径。
作为全球公认准入门槛最高的医疗大模型专业评测体系,HealthBench的考题覆盖临床问诊、病例分析、诊疗方案制定等全流程医疗场景,其中Hard、Professional两个子榜单更是分别针对疑难罕见病识别、诊疗合规性判断设置了极高的专业门槛,此前头部位置长期被海外通用大模型占据。本次Baichuan-M4不仅拿下总榜第一,在两个子榜单的得分也分别领先GPT-5.5 8.2个、6.9个百分点,是首个在该评测全赛道登顶的国产大模型。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录