2026年4月,微软正式开源全新多模态推理模型Phi-4-reasoning-vision-15B,该模型参数规模仅15B,全程仅用200B高质量多模态token训练完成,主打轻量化路线,在科学推理、复杂视觉任务上实现了优异表现,可为资源受限的部署场景提供低成本多模态AI方案,填补了小参数模型复杂推理能力的市场空白。
当前AI大模型领域的“参数竞赛”“数据堆料”已经逐渐走入瓶颈,不少头部多模态模型动辄千亿参数、万亿训练token,不仅训练成本高昂,普通开发者甚至中小科技公司都难以承担部署成本,更不用说在边缘端、端侧设备落地。
Phi系列一直是微软在小参数高质量模型路线的核心探索,这次发布的Phi-4-reasoning-vision-15B延续了这一思路,完全没有跟风堆料。研发团队将数据质量放在首位,通过深度清洗开源数据、定向生成领域合成数据、优化不同任务的数据配比,实现了高效训练——比如针对性增加数学领域数据,还同步提升了模型的计算机操作与视觉推理能力。整个训练过程只用了200B多模态token,不到当前主流大模型训练数据量的十分之一。
除了数据端的创新,该模型最值得关注的设计是混合推理路径机制,根据任务难度动态调整推理链路,从架构层面优化了算力利用率。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年以来,全球天文领域正大规模落地AI星系探测技术,科研团队依托GPU算力支撑,可快速从PB级星际观测数据中筛选出微弱的未知天体信号。这类新增科研算力需求,已成为继大语言模型训练、AIGC内容生产之后,全球GPU供应缺口扩大的新诱因,当前高端通用GPU交付周期已延长至14个月,高端H100芯片市场溢价率超40%。

1 小时前
4月21日MIT Technology Review资深记者Mat Honan发布专题报道指出,2026年全球AI应用渗透率已突破72%,覆盖办公、消费、公共服务等全场景,但伴随隐私争议、岗位替代焦虑、信息过载等问题持续发酵,公众对AI的正面认可度较2023年峰值下跌28个百分点,全球AI产业首次进入业界所称的“AI倦怠期”。

2 小时前
2026年4月23日,腾讯正式发布混元系列最新开源大语言模型Hy3 Preview,该模型总参数达295亿,在复杂推理、指令遵循、代码处理等维度表现实现显著提升,研发阶段坚持实用性、真实评测、高性价比三大原则,目前已接入多款腾讯自有产品,同时兼容主流开源智能体工具,为开发者提供了新的高性价比选型。

2 小时前
Alphabet首席执行官桑达尔·皮查伊近日披露,谷歌内部超75%的新增代码已由人工智能自动生成,标志其“AI优先”战略落地取得实质性突破。该比例2025年4月仅为30%,一年间涨幅超150%,所有AI生成代码仍需经过专业开发工程师严格审核以保障安全。2026年Alphabet预计全年资本支出将达1750亿美元,持续加码AI底层布局。

2 小时前
2026年4月23日第26个世界知识产权日来临前夕,杭州市中级人民法院公开开庭审理全国首例AI智能体流量劫持不正当竞争案,该案由杭州中院院长、一级高级法官唐学兵担任审判长。原告为AI应用“K智能体”运营方,指控被告通过输入法植入的“W智能大模型”功能劫持自身平台用户流量,案件引发AI领域竞争规则的广泛讨论。

2 小时前
2026年4月以来,国内社交平台接连出现AI合成虚假资讯:先是伪造的小米汽车官宣苹果CEO库克出任CEO海报登上微博热搜,小米高管紧急公开辟谣;随后特斯拉CEO马斯克加入拼多多旗下拼好饭的假海报再度引发大范围传播,此类足以乱真的AI合成内容造谣成本近乎为零,引发公众对数字时代信息真实性的广泛讨论。

2 小时前
2026年4月23日消息,阿里巴巴旗下AI助手千问首次向商业合作伙伴开放Agent技术,首个落地场景接入中国东方航空。用户可通过自然语言指令完成航班查询、出票、选座等全流程机票服务操作,无需跳转传统菜单界面,还可延伸享受机场行程规划、接送机预约等一站式出行服务。

2 小时前
美国民主党联邦参议员伊丽莎白·沃伦于2026年4月公开预警,称当前AI行业普遍高杠杆融资、收入增速不及支出扩张的现状,正积累类似2008年金融危机的系统性风险。大量AI企业转向缺乏监管的私募信贷渠道募资,若后续债务问题集中爆发,可能引发连锁金融动荡,沃伦呼吁国会加快推动数字领域监管框架落地。