国产多模态医疗大模型登顶权威榜单,技术路径成行业范本

5 小时前 AI快讯 0

国产多模态医疗大模型登顶权威榜单,技术路径成行业范本

2月7日,中文医疗大模型权威评测平台MedBench发布最新多模态大模型榜单,数坤科技推出的数坤坤多模态医学大模型V3以63.6分的成绩斩获榜首,不仅超越微医、云知声等同行医疗大模型,还在评测中击败OpenAI、谷歌、阿里千问旗下的通用大模型,成为中文医疗AI领域的新标杆,其背后的技术路径引发行业广泛关注。

MedBench作为中文医疗大模型领域的核心评测平台,其评测体系覆盖多模态医疗全场景任务,包括医学影像精准判读、复杂病历综合分析、智能问诊逻辑推导、医学文献深度解读等多个核心维度,全面考验大模型的医学专业能力与临床实用性。此次参评的模型涵盖国内头部医疗AI企业的垂直领域大模型,以及国内外科技巨头的通用大模型,竞争烈度堪称近年之最,数坤V3的登顶成绩含金量十足。

成立于2017年的数坤科技,此前已在医学影像AI赛道深耕多年,积累了扎实的技术基础与行业资源。此次从单一影像AI升级为多模态医疗大模型,其迭代逻辑始终紧扣“贴近临床真实需求”的核心。据内部人士透露,数坤V3的核心竞争力主要来自两大关键布局:

首先是PB级高质量合规医疗训练数据。医疗数据的特殊性在于专业性强、隐私门槛高,数坤通过合规渠道累计了涵盖医学影像、电子病历、检验报告、中外医学典籍等多类型的PB级数据——1PB相当于1024TB,足以支撑模型完成对百万级临床场景的学习。这些数据还经过严格的脱敏处理、专业医师标注与质量校验,确保了数据的真实性与临床参考价值,这是多数同行甚至通用大模型难以企及的核心优势——通用大模型虽训练数据总量庞大,但医疗领域的精准标注数据占比极低,无法支撑专业场景的深度能力构建。

其次是模拟医生真实会诊过程的场景化训练。不同于传统大模型的单任务式训练,数坤V3构建了接近真实临床的多模态会诊场景:模型需要像资深医师一样,先读取患者的CT、核磁等影像片,再结合病历中的病史描述、症状记录,以及检验报告的各项量化指标,进行跨维度的综合分析,最终给出符合临床逻辑的诊断建议与治疗参考。这种训练方式让模型真正具备了“临床思维”,而非简单的知识检索或数据匹配。

此次评测中,海外通用大模型的表现甚至不如国内垂直医疗大模型,再次印证了“通用大模型在专业领域需场景化深耕”的行业共识。数坤V3的登顶,也让行业看到了国产医疗AI的自主创新潜力——不再是跟随通用大模型的技术框架,而是基于医疗行业的真实需求,走出了一条“数据+场景”双驱动的技术路径。

对于医疗行业而言,这样的多模态大模型落地后,有望在多个场景释放价值:在基层医疗机构辅助医生快速完成影像判读与病历分析,提升诊断效率与准确率;在远程医疗场景打破地域限制,让偏远地区患者获得接近三甲医院的诊断服务;还能辅助医学研究人员快速梳理海量文献,加速新药研发与疾病研究进程。

随着国内医疗AI监管体系的完善与高质量数据的持续积累,多模态医疗大模型的竞争将从“技术参数比拼”转向“临床实用性落地”。数坤科技的此次登顶,不仅是技术实力的证明,也为行业提供了可借鉴的发展范本。未来,或许会有更多国产医疗AI突破技术瓶颈,真正走进临床一线,成为医生的“智能战友”,推动智慧医疗的普及与升级。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创