PinchBench是面向OpenClaw AI编码智能体的专属LLM基准测试平台,核心定位是帮助用户快速筛选适配OpenClaw场景的最优大模型。平台目前已覆盖50+主流大模型、600+测试运行数据,所有测试结果通过自动化校验+大模型评审双重机制保障准确性。相较于通用大模型评测工具,其聚焦AI编码代理场景,测评维度完全贴合实际开发需求,参考价值更高。
平台展示的测评结果清晰呈现不同大模型在OpenClaw标准化测试任务的成功率排名,例如anthropic旗下大模型处于高成功率第一梯队;同时支持不同预算区间的高性价比模型推荐,用户可直接获取经过实际编码任务验证的选型参考,无需自行搭建测试环境验证模型适配性,选型效率可提升80%以上。

1 小时前
3月26日,国际顶级学术出版机构Nature旗下Nature Index China特刊刊发两篇深度报道,系统呈现教育集团天立国际在“AI+教育”领域的落地成果,聚焦中国K12教育场景下的教育通用人工智能(AGI)应用实践,展示其用技术缩小区域教育资源差距、推动教育公平的探索路径,相关内容随Nature正刊同步上线官网。

1 小时前
2026年3月29日,在第二届浦江AI学术年会上,上海人工智能实验室正式发布面向重大科学突破的“AGI for Science珠穆朗玛计划”(简称AGI4S珠穆朗玛计划)。该计划瞄准科学智能领域全球顶尖水平,将打造领先的AGI4S基座能力,汇聚全链条创新要素,构建中国科学智能创新中枢,助力全球科研工作者攻坚前沿科学难题。

1 小时前
2026年3月31日,苹果面向国内iPhone用户正式推送国行专属AI功能“Apple智能”,该功能与Siri深度打通,采用多模型调度策略,国内适配场景底层接入百度文心大模型,这也是苹果首次在国内消费级终端搭载国产大模型服务,瞬间刷屏消费电子圈与AI产业,引发大量用户与行业人士讨论。

1 小时前
2026年3月30日,阿里正式推出新一代全模态大模型Qwen3.5-Omni。该模型原生支持文本、图片、音视频多模态输入,适配256k长上下文与最长10小时音频输入,实测可完整理解50分钟《老友记》剧情,在全球215项权威评测中拿下SOTA,部分性能表现超过谷歌Gemini 3.1 Pro。

1 小时前
2026年3月30日,全球最大光计算独角兽曦智科技正式向港交所递交IPO招股书。该公司由沈亦晨博士于2017年创立,专注于光互连、光计算技术研发,商业化进度全球领先,腾讯、百度均为其早期投资方,目前已走出试点阶段,下游已有AI芯片企业完成下单,本次IPO被视作光计算技术规模化商用的标志性节点。

1 小时前
2026年3月29日第二届浦江AI学术年会开幕期间,上海人工智能实验室DeepLink团队正式发布《超节点技术体系白皮书》。该白皮书联合8所顶尖高校、16家核心产业伙伴共同形成产业共识,针对超节点规模化落地过程中异构协同难、跨域调度效率低、工程化部署复杂等核心痛点,为产业实践提供了体系化的理论指导。

1 小时前
2026年3月30日,中国联通发布山东济南市行业客户智算一体机服务项目中标候选人公示,百度以2.9亿元预中标该项目,采购内容包含260台额定参数为64核、主频2.7GHz、功耗400W的智算一体机。该订单是国内运营商2026年Q1落地的代表性大额智算采购项目,侧面反映出国内AI算力需求的持续攀升态势。

1 小时前
2026年3月30日《华尔街日报》发布深度调查,披露OpenAI关停AI视频生成工具Sora的核心动因。此前外界普遍猜测关停与数据收集合规争议有关,实际核心原因是Sora运营成本过高、单日运营成本超过产品上线以来总营收,叠加用户快速流失,最终促使OpenAI高层决定放弃该业务,聚焦核心产品线研发。