2026年3月31日,微软正式为Microsoft 365 Copilot的研究员工具模块上线全新Critique功能,首次实现OpenAI GPT与Anthropic Claude两大主流大模型跨生态协同工作,搭配独创的“理事会”多智能体校验机制,经DRACO测试验证,其复杂学术任务处理效果显著优于任意单一模型,可大幅降低AI生成内容的幻觉发生率。
对于每天要处理大量文献调研、数据汇总、初稿撰写的科研人员而言,AI生成内容的“幻觉问题”始终是悬在头顶的风险:看似逻辑通顺的段落里可能藏着虚构的参考文献、偏差的实验数据,事后核查往往要耗费数倍于生成的时间。微软此次推出的新功能,正是瞄准这一行业痛点给出的解法。
在全新的Critique功能工作流中,GPT凭借其成熟的长文本生成、多源信息整合能力,承担研究初稿的撰写工作,可快速完成文献梳理、实验结论汇总等基础任务;来自Anthropic的Claude则以“专业审稿人”的身份接入,按照对应领域的学术规范,对内容的事实准确性、逻辑严谨性、论据完整性进行逐行核查,标注出潜在的错误、遗漏以及不符合学术规范的表述。
这种“生成+校验”的双模型分工,恰好利用了两款大模型的各自优势:GPT的信息整合效率更高,而Claude对长文本的事实核查能力、规则遵循能力表现更突出,二者互补刚好覆盖了学术内容生产的核心需求。
除了基础的GPT生成、Claude审核的双向流程,微软还为这套系统配套了独创的“理事会”(Council)机制:多个物理隔绝的独立大模型会同步对同一任务进行处理,分别输出各自的研究结果,最终由专门训练的“裁判模型”对所有输出内容进行交叉比对、可信度评估,最终生成综合最优的终稿。这种模式本质上是模拟了人类学术研究中的同行评议流程,最大化规避单一模型的训练偏见与输出误差。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
近期,科技巨头微软针对旗下AI助手Copilot发布官方用户提示,明确不建议用户在高风险场景下过度依赖该工具。作为微软过去5年重点布局的核心AI产品,Copilot已覆盖Windows系统、Office办公套件、Azure云服务等全产品线,此前累计投入相关研发推广资源超100亿美元,此次态度转向引发AI产业对通用助手落地边界的广泛讨论。

4 小时前
近期微软确认将加大自研AI模型投入,打破此前AI产品线核心能力主要依赖OpenAI技术的合作模式,旗下AI助手Copilot、Azure云AI服务将逐步接入自研大模型,与OpenAI GPT系列、谷歌Gemini系列形成直接竞争。本次自研模型覆盖通用对话、代码生成、多模态处理等场景,预计2025年上半年完成核心产品线适配。

20 小时前
2026年4月4日,大模型厂商Anthropic正式官宣生态政策调整:从美国东部时间4月4日15点(北京时间4月5日3点)起,旗下Claude大模型将禁用OpenClaw等第三方工具,用户后续仅能通过额外付费套餐或Claude API Key调用相关工具。该政策将率先在OpenClaw落地,未来覆盖全部第三方工具链,是大模型厂商收紧生态控制权、加速商业化的标志性动作。

1 天前
近期Meta、微软、谷歌等海外头部科技企业相继公布天然气电厂建设计划,为旗下高速扩张的AI数据中心提供稳定电力支撑。随着生成式AI普及,单座AI算力中心能耗是传统数据中心的3-5倍,现有公共电网已难以满足企业爆发式算力供电需求,化石能源供电方案也引发了业内对碳目标达成、长期运营风险的广泛讨论。

1 天前
据科技媒体The Information及行业分析师Eric Newcomer披露,AI大模型厂商Anthropic已于近期完成对秘密运营的生物科技AI初创公司Coefficient Bio的收购,本次交易为全股票形式,总对价达4亿美元。这是Anthropic首次落地生命科学垂直领域布局,也标志着大模型厂商商业化正加速向生物医药赛道渗透。

1 天前
2026年以来,微软、Meta、Google等全球科技巨头先后启动配套天然气发电厂建设项目,以满足AI大模型训练、推理所需的超算数据中心爆发式增长的能耗需求。行业测算显示,头部AI算力集群的单位能耗是传统数据中心的5-10倍,这一能源布局已引发行业关于碳排放、长期能源结构合理性的广泛讨论。

1 天前
近日,AI大模型企业Anthropic宣布为旗下对话式AI产品Claude推出Windows平台本地交互能力,新版本可直接跨应用调取用户邮件、本地存储的各类文档,还能自主执行系统级任务操作。据官方披露,该功能可将文档整理、日程响应类办公流程的处理效率提升45%,无需用户手动上传文件即可完成复杂指令。

1 天前
近期Anthropic源代码泄露事件中,安全研究者发现针对其旗下代码大模型Claude Code的新型prompt逃逸攻击路径,可绕过内容安全审查执行违规操作,而该类漏洞此前Anthropic公开表示已完成修复。目前该漏洞可导致代码生成环节出现恶意植入、数据泄露等风险,Anthropic尚未就新漏洞给出官方回应。