2026年7月,OpenAI正式发布面向生物研究场景的AI能力基准测试GeneBench-Pro。该基准聚焦评估AI模型在基因组学、蛋白质组学、转化医学等领域的复杂数据分析能力,针对真实科研中普遍存在的不完整、带干扰的非标准化数据设计129道测试题,突破传统基准偏重记忆和固定流程的局限,可精准反映AI在生物研究场景的实用价值。

近年基因组测序、蛋白质组分析技术的快速普及,让生物科研数据量以每年35%的速度增长,但一线科研人员普遍反馈,超过60%的真实研究数据都存在片段缺失、背景噪声、样本污染等问题。此前的AI模型评估基准大多采用标准化清洗后的数据集,训练出的模型在实验室测试中表现亮眼,到了真实科研场景却往往准确率大幅下滑,始终难以落地到实际研究中。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录