2026年3月哈佛大学Schwartz教授公布最新实验成果,其采用对标人类研究生培养的导师制模式,仅用两周就将Anthropic旗下大语言模型Claude培养至物理专业研二研究员水平。实验期间双方累计完成270次深度对话、消耗3600万tokens,Claude经110次草稿迭代输出符合学术规范的专业科研产出,标志着大模型正式具备深度参与前沿科研的能力。
近年大模型在学术科研领域的应用始终停留在文献整理、数据演算等辅助环节,其独立开展系统性研究的能力一直是行业争议的焦点,而哈佛大学最新公布的一项实验结果,彻底刷新了外界对大模型科研潜力的认知。
在这场为期14天的训练中,Schwartz教授完全参照物理系研究生的培养逻辑设计教学方案,Claude的成长轨迹也与人类学生高度重合。面对复杂的前沿物理课题,Claude首先展现出成熟的任务拆解能力:它主动联动GPT-5.2、Gemini3.0等其他大模型交叉验证思路,最终将原本庞杂的研究课题拆解为102个可落地的细碎任务,覆盖文献调研、公式推演、结论验证等全科研流程。
整个训练周期内,Schwartz教授与Claude累计完成270次深度对话,总消耗token量达到3600万,相当于给Claude投喂了近百本物理专业专著与顶刊论文的知识量。经过110次草稿迭代后,Claude最终独立完成了符合物理系研二学术标准的科研成果,其逻辑严谨性、结论创新性都通过了物理系匿名评审的验证。
此前大模型在科研场景的定位始终是“知识检索工具”,仅能承担文献整理、数据计算等边缘性辅助工作,无法独立开展系统性研究。而此次Claude达到物理专业研二水平,意味着大模型已经跨过了科研入门的门槛:普通研二学生已经完成了全部专业基础课学习,能够独立承担细分方向的子课题研究,产出符合学术规范的阶段性成果。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
41 分钟前
近期GitHub、Stack Overflow等全球开发者平台监测数据显示,AI编码工具普及后开发者人均编码效率提升超220%,但低质量重复“垃圾代码”占比同比上涨47%。包括OpenAI ChatGPT、GitHub Copilot、DeepSeek Coder在内的主流AI编码工具均被指易生成冗余、兼容性差的代码,给长期项目维护埋下风险,引发全球开发社区广泛热议。

43 分钟前
4月6日,小米MiMo大模型负责人罗福莉在海外社交平台X公开发文,结合此前Anthropic宣布Claude封禁OpenClaw等第三方工具、小米MiMo推出分层Token定价套餐的行业动态,系统拆解Agent场景下的算力分配与大模型定价逻辑,驳斥当前行业盲目开展价格战的短视行为,引发AI产业界对大模型健康商业化路径的广泛讨论。

1 小时前
4月7日,AI大模型厂商Anthropic官方披露其年化收入(ARR)已突破300亿美元,首次反超竞争对手OpenAI同期250亿美元的年化收入水平。该公司2025年末年化收入仅为90亿美元,3个多月内收入规模大涨约210亿美元,同时同步官宣最新AI芯片采购大单,引发全球AI产业对大模型商业化格局的广泛讨论。

3 小时前
2026年4月,欧洲头部人工智能企业Mistral AI联合创始人兼CEO Arthur Mensch访韩期间,与三星电子副董事长兼CEO全永铉及核心高层会晤,双方重点围绕AI半导体存储芯片供应链、技术协同方案展开磋商。Mistral AI正寻求稳定XPU算力芯片供应以支撑模型迭代,三星在高带宽内存...

3 小时前
2026年4月,OpenAI首席执行官山姆·奥特曼在公开专访中首度回应文生视频模型Sora停用传闻,明确表示关停并非源于技术瓶颈,而是公司当前存在极大算力缺口,有限的芯片资源将优先供给GPT系列大模型迭代等更高优先级项目,Sora因内部优先级排位靠后遭遇资源挤兑暂时下线。

3 小时前
2026年4月国际大模型API分发平台OpenRouter公布的最新榜单显示,阿里旗下千问3.6 Plus登顶全球大模型周调用量榜首,且已连续4天霸榜日榜,该模型也成为平台上线以来首个单日调用量突破1万亿Token的大模型,标志着国产大模型凭借技术迭代、高性价比优势在全球市场的竞争力进一步提升。

3 小时前
近期凭借OpenClaw(俗称“小龙虾”)插件走红的国产大模型MiniMax 2.7,官方于2026年4月7日确认将于本周末在Hugging Face社区发布开源版本。该模型3月18日上线后调用量长期位居行业前列,SWE-Pro基准测试得分达56.22%接近顶尖闭源模型水平,开源后将大幅降低开发者Token调用成本,利好下游AI应用落地。

5 小时前
2026年4月7日,通义千问宣布升级旗下“深度研究”功能,正式上线专业财经分析模块。本次升级基于Agentic架构整合同花顺实时金融数据,覆盖全球1.3万只股票分钟级行情、近百万份上市公司财报及权威研报,可全链路自主生成可溯源的专业研报,当前已在多端开放免费体验。