2026年3月哈佛大学Schwartz教授公布最新实验成果,其采用对标人类研究生培养的导师制模式,仅用两周就将Anthropic旗下大语言模型Claude培养至物理专业研二研究员水平。实验期间双方累计完成270次深度对话、消耗3600万tokens,Claude经110次草稿迭代输出符合学术规范的专业科研产出,标志着大模型正式具备深度参与前沿科研的能力。
近年大模型在学术科研领域的应用始终停留在文献整理、数据演算等辅助环节,其独立开展系统性研究的能力一直是行业争议的焦点,而哈佛大学最新公布的一项实验结果,彻底刷新了外界对大模型科研潜力的认知。
在这场为期14天的训练中,Schwartz教授完全参照物理系研究生的培养逻辑设计教学方案,Claude的成长轨迹也与人类学生高度重合。面对复杂的前沿物理课题,Claude首先展现出成熟的任务拆解能力:它主动联动GPT-5.2、Gemini3.0等其他大模型交叉验证思路,最终将原本庞杂的研究课题拆解为102个可落地的细碎任务,覆盖文献调研、公式推演、结论验证等全科研流程。
整个训练周期内,Schwartz教授与Claude累计完成270次深度对话,总消耗token量达到3600万,相当于给Claude投喂了近百本物理专业专著与顶刊论文的知识量。经过110次草稿迭代后,Claude最终独立完成了符合物理系研二学术标准的科研成果,其逻辑严谨性、结论创新性都通过了物理系匿名评审的验证。
此前大模型在科研场景的定位始终是“知识检索工具”,仅能承担文献整理、数据计算等边缘性辅助工作,无法独立开展系统性研究。而此次Claude达到物理专业研二水平,意味着大模型已经跨过了科研入门的门槛:普通研二学生已经完成了全部专业基础课学习,能够独立承担细分方向的子课题研究,产出符合学术规范的阶段性成果。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 小时前
国内大模型厂商DeepSeek近日宣布旗下旗舰级通用大模型服务价格下调75%,其模型性能在MMLU、GSM8K等多项国际通用基准测试中位列全球第一梯队,降价后单位Token推理成本仅为OpenAI GPT-4的1/20。此次调价被业内视为大模型商用落地的标志性事件,有望加速AI服务在中小企业、C端场景的普及,同时倒逼全球大模型厂商调整定价逻辑。

9 小时前
近期全球科技行业监测数据显示,2024年第三季度全球C端AI工具月活跃用户规模突破8.5亿,OpenAI GPT-5研发进展、谷歌Gemini多模态能力升级、DeepSeek开源模型放量、苹果Apple Intelligence端侧落地等事件成为行业核心关注焦点,AI agent、AI PC等新落地场景也进入规模化渗透前期,整个赛道的商业化节奏明显加快。

14 小时前
近日微软研究院推出终端原生网页智能代理框架Webwright,在通用网页任务测试集Odysseys中拿下60.1%的得分,较基础版GPT-5.4的33.5%提升近80%,同时在Online-Mind2Web测试中得分达86.7%,是当前网页代理领域性能最优的开源框架之一,为网页自动化、智能信息检索等场景落地提供了新的技术路径。

1 天前
近日有行业消息披露,谷歌、Meta、微软三家全球科技巨头正在采购由雇主端监控工具(Bossware)采集的海量员工办公行为数据,用于旗下大语言模型、办公AI助手等产品的训练优化。涉及数据包含打字记录、会议交流内容、任务处理流程等多维度信息,相关交易的合规性已引发科技伦理领域的广泛讨论。

1 天前
近日,微软宣布调整Office套件的Copilot AI助手交互逻辑,新增悬浮Copilot按钮的手动关闭选项,解决了此前用户反馈的常驻悬浮键遮挡编辑区域、误触率高等问题。作为微软面向办公场景落地的核心AI工具,Copilot目前已覆盖Office全系列办公应用,全球付费企业用户规模已突破3000万,本次功能更新将进一步优化不同使用习惯用户的体验。

1 天前
近日,AI开源研究机构Nous Research正式发布全新大模型调控技术对比神经元归因(Contrastive Neuron Attribution,简称CNA)。该技术无需进行稀疏自动编码器(SAE)训练,也不需要修改模型权重参数,仅通过消融稀疏MLP电路即可实现对大语言模型行为的精准控制,大幅降低了大模型对齐与功能定向修改的技术门槛与算力成本。

2 天前
2024年下半年以来,全球AI赛道迎来新一轮产品迭代潮:OpenAI下一代大模型GPT-5研发进入收尾阶段,Google Gemini全端覆盖用户突破10亿,苹果Apple Intelligence随新系统正式推送,国内厂商DeepSeek、Perplexity等垂直类AI工具月活涨幅超60%,AI代理、AI PC等新形态应用也从概念走向落地,全行业商业化进程持续提速。

2 天前
近日独立AI创作者借助OpenAI GPT-4o、DeepSeek大模型等工具,成功复刻科幻名作《挽救计划》(Project Hail Mary)的全星系恒星地图,经原著爱好者联合校验,该星图对书中提及的12万颗天体坐标还原度达99.7%,误差控制在0.3%以内,远超此前所有同人衍生内容的制作精度,成为近期生成式AI落地小众创作领域的标杆案例。