OpenAI发布GeneBench-Pro 重构生物领域AI能力评估标准

AI创作导航管理员 LV4 资深连续登录7天萌新

3 小时前

风向

2026年7月，OpenAI正式发布面向生物研究场景的AI能力基准测试GeneBench-Pro。该基准聚焦评估AI模型在基因组学、蛋白质组学、转化医学等领域的复杂数据分析能力，针对真实科研中普遍存在的不完整、带干扰的非标准化数据设计129道测试题，突破传统基准偏重记忆和固定流程的局限，可精准反映AI在生物研究场景的实用价值。

近年基因组测序、蛋白质组分析技术的快速普及，让生物科研数据量以每年35%的速度增长，但一线科研人员普遍反馈，超过60%的真实研究数据都存在片段缺失、背景噪声、样本污染等问题。此前的AI模型评估基准大多采用标准化清洗后的数据集，训练出的模型在实验室测试中表现亮眼，到了真实科研场景却往往准确率大幅下滑，始终难以落地到实际研究中。

大语言模型 OpenAI 人工智能生物信息学 GeneBench-Pro

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

OpenAI发布GeneBench-Pro 重构生物领域AI能力评估标准

最新文章

X社区 · 无限公约

二狗PPT

Cloudflare推出精细化AI流量管理工具破解站长爬虫管控两难

xAI发布Voice Agent Builder测试版两分钟搭建生产级语音智能体

昆仑万维发布天工3.2 Skywork Tags赋能办公群原生AI协作

支付宝AI助手「阿宝」启动公测对话式交互重构民生办事路径

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

OpenAI发布GeneBench-Pro 重构生物领域AI能力评估标准

最新文章

X社区 · 无限公约

二狗PPT

Cloudflare推出精细化AI流量管理工具 破解站长爬虫管控两难

xAI发布Voice Agent Builder测试版 两分钟搭建生产级语音智能体

昆仑万维发布天工3.2 Skywork Tags赋能办公群原生AI协作

支付宝AI助手「阿宝」启动公测 对话式交互重构民生办事路径

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

Cloudflare推出精细化AI流量管理工具破解站长爬虫管控两难

xAI发布Voice Agent Builder测试版两分钟搭建生产级语音智能体

支付宝AI助手「阿宝」启动公测对话式交互重构民生办事路径