登录体验完整功能(收藏、点赞、评论等) — 已累计有 12598 人加入

OpenAI发布GeneBench-Pro 重构生物领域AI能力评估标准

详情页推荐

2026年7月,OpenAI正式发布面向生物研究场景的AI能力基准测试GeneBench-Pro。该基准聚焦评估AI模型在基因组学、蛋白质组学、转化医学等领域的复杂数据分析能力,针对真实科研中普遍存在的不完整、带干扰的非标准化数据设计129道测试题,突破传统基准偏重记忆和固定流程的局限,可精准反映AI在生物研究场景的实用价值。

配图

近年基因组测序、蛋白质组分析技术的快速普及,让生物科研数据量以每年35%的速度增长,但一线科研人员普遍反馈,超过60%的真实研究数据都存在片段缺失、背景噪声、样本污染等问题。此前的AI模型评估基准大多采用标准化清洗后的数据集,训练出的模型在实验室测试中表现亮眼,到了真实科研场景却往往准确率大幅下滑,始终难以落地到实际研究中。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。