2026年4月,日本AI公司LifePrompt公布最新测试结果,基于OpenAI最新模型开发的ChatGPT,在东京大学、京都大学两所日本顶尖高校的本科入学考试中,整体成绩全面超越人类顶尖考生。其中在竞争最激烈的东京大学医学专业入学考试中,ChatGPT得分比人类最高分高出50分,多个科目拿到满分,成绩较2024年的同类测试实现大幅突破,引发行业广泛关注。
本次测试覆盖东京大学多个招生学科以及京都大学法学、医学专业,AI的领先优势在所有类别的测试中都保持稳定。在东京大学人文社会类考试中,ChatGPT取得452分,超过该类别录取最高分考生的434分;理科类考试中,AI得分为503分,高出录取最高分49分,医学专业考试的领先优势更是达到50分。多个理科科目中,ChatGPT拿到满分,展现出远超普通人类考生的精准计算与知识点整合应用能力。
这并不是GPT系列模型第一次挑战日本顶尖大学入学考试。早在2024年的同类测试中,旧版本的ChatGPT还没能通过东京大学所有类别的入学考试,整体成绩远低于人类顶尖考生的分数线。本次测试由日本AI公司LifePrompt按照正式考试的标准流程完成命题适配与评分,采用OpenAI最新迭代的大模型基底,成绩的飞跃直观展现了大语言模型两年间的技术进步速度。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
23 秒前
AI芯片厂商Cerebras于2026年5月正式登陆公开市场,本次IPO合计募资55亿美元,上市首日股价涨幅达108%,成为2026年开年以来首个规模超十亿美元的科技IPO项目。作为全球最早布局晶圆级AI训练芯片的厂商之一,Cerebras本次上市也被视作AI硬科技赛道融资回暖的标志性信号。

2 分钟前
近日面向AI编码群体的开源工具Clawdmeter正式发布,该工具可将Anthropic旗下Claude Code的使用频次、token消耗、代码生成效率等核心数据汇总至轻量桌面面板,目前已面向全球开发者开源。据产品发布信息显示,该工具主要针对日均调用Claude Code超过50次的重度编码用户,可帮助用户降低近80%的使用数据查询操作成本。

4 分钟前
2026年5月13日,AI大模型厂商Anthropic正式推出面向小微企业的专属产品Claude for Small Business,该产品预装多工具连接器与开箱即用的标准化工作流,可直接适配小微企业日常使用的各类办公工具。数据显示,小微企业贡献美国44%的GDP,吸纳近一半私营部门劳动力,该产品瞄准这一群体的AI落地痛点,大幅降低AI使用门槛。

8 分钟前
AI初创公司Anthropic正式推出适配微软Microsoft 365生态的AI助手产品Claude for Microsoft 365。至此Anthropic旗下Claude系列产品已完成Chrome、Slack、Office办公生态等主流生产力场景覆盖,将与OpenAI旗下Copilot fo...

10 天前
美国AI安全与研发公司Anthropic近日宣布,联合全球另类资产管理巨头黑石、头部私募机构Hellman & Friedman、国际投行高盛共同成立全新企业级AI服务公司。新公司将聚焦各行业中型企业需求,将Anthropic旗下大语言模型Claude落地到企业核心业务场景,首批Anthropic应用AI工程师已确认入驻新公司核心团队。

11 天前
近期全球AI赛道动作密集,OpenAI推进GPT-5研发、微软Copilot商业化覆盖超1亿用户、谷歌Gemini多模态能力迭代、苹果Apple Intelligence完成端侧部署适配,国产厂商DeepSeek、Perplexity等也在垂直场景跑出差异化优势,端侧大模型渗透率预计2025年将突破40%,行业已进入技术落地与场景渗透的关键期。

11 天前
随着千亿参数级通用大语言模型(LLM)在企业落地过程中逐步触达规模与成本的双重瓶颈,面向垂直场景定制优化的小语言模型(SLM)正成为市场新热点。据行业测算,同等推理任务下SLM的运行成本仅为通用大模型的1/10到1/5,推理速度提升3至8倍,同时可实现本地化部署规避数据泄露风险,正在推动企业AI架构的全面重构。

11 天前
据AI产业研究院最新监测数据,当前国内82%的企业级AI项目交付效果不达预期,其中仅17%源于大模型本身质量缺陷,超7成问题出自效果评估体系缺失。业内近期首次提出「评估卫生(Eval Hygiene)」概念,呼吁建立全流程AI效果度量标准,解决过往人工抽查评估导致的效果偏差、合规风险等共性痛点。