登录体验完整功能(收藏、点赞、评论等)

少找工具,多做创作

微软上线Critique功能:GPT与Claude协同赋能学术研究场景

2026年3月31日,微软正式为Microsoft 365 Copilot的研究员工具模块上线全新Critique功能,首次实现OpenAI GPT与Anthropic Claude两大主流大模型跨生态协同工作,搭配独创的“理事会”多智能体校验机制,经DRACO测试验证,其复杂学术任务处理效果显著优于任意单一模型,可大幅降低AI生成内容的幻觉发生率。

对于每天要处理大量文献调研、数据汇总、初稿撰写的科研人员而言,AI生成内容的“幻觉问题”始终是悬在头顶的风险:看似逻辑通顺的段落里可能藏着虚构的参考文献、偏差的实验数据,事后核查往往要耗费数倍于生成的时间。微软此次推出的新功能,正是瞄准这一行业痛点给出的解法。

在全新的Critique功能工作流中,GPT凭借其成熟的长文本生成、多源信息整合能力,承担研究初稿的撰写工作,可快速完成文献梳理、实验结论汇总等基础任务;来自Anthropic的Claude则以“专业审稿人”的身份接入,按照对应领域的学术规范,对内容的事实准确性、逻辑严谨性、论据完整性进行逐行核查,标注出潜在的错误、遗漏以及不符合学术规范的表述。

这种“生成+校验”的双模型分工,恰好利用了两款大模型的各自优势:GPT的信息整合效率更高,而Claude对长文本的事实核查能力、规则遵循能力表现更突出,二者互补刚好覆盖了学术内容生产的核心需求。

除了基础的GPT生成、Claude审核的双向流程,微软还为这套系统配套了独创的“理事会”(Council)机制:多个物理隔绝的独立大模型会同步对同一任务进行处理,分别输出各自的研究结果,最终由专门训练的“裁判模型”对所有输出内容进行交叉比对、可信度评估,最终生成综合最优的终稿。这种模式本质上是模拟了人类学术研究中的同行评议流程,最大化规避单一模型的训练偏见与输出误差。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创