近日,阿里千问团队在X平台开源Qwen3.5小模型系列,涵盖0.8B、2B、4B、9B四个参数规格,特斯拉CEO马斯克现身评论区互动,却因阿里千问大模型负责人林俊旸突然离职的消息被舆论忽略。这一细节既折射出小模型赛道的升温趋势,也凸显马斯克对中国AI技术的持续关注。
当阿里千问大模型负责人林俊旸离职的消息迅速攻占科技话题热搜榜时,另一桩更关乎中国AI技术生态布局的事件被悄然冲淡——3月上旬,阿里千问团队在X平台发布官方推文,正式对外开源Qwen3.5小模型系列,而特斯拉CEO马斯克的现身评论,本该成为跨圈技术话题的引爆点,却几乎未进入公众视野。
在大模型竞争进入深水区的当下,小模型凭借低部署成本、高场景适配性的优势,正成为AI技术落地的核心抓手。此次阿里千问开源的Qwen3.5小模型,包含0.8B、2B、4B、9B四个参数规格,覆盖从消费级边缘设备到轻量云端服务的多元应用场景。不同于大模型对超算中心算力的苛刻要求,这类小模型可直接运行在普通服务器甚至智能手机上,既为中小企业、独立开发者降低了AI应用的技术门槛,也推动AI技术从实验室走向更多实体产业场景。
马斯克此次现身阿里千问推文评论区,并非孤立的兴趣使然。近期他频繁为中国AI技术站台,从公开肯定中国AI的研发速度,到主动关注具体技术产品,背后暗含他对AI技术路径的判断:小模型的轻量化、高落地性优势,或许能与特斯拉自动驾驶的边缘计算需求形成天然契合。对马斯克而言,中国AI团队在小模型领域的开源动作,既是技术生态开放的信号,也为其自身的AI布局提供了可参考的实践样本。
林俊旸离职的消息能迅速盖过小模型开源的热度,折射出科技舆论场的固有偏好:人事变动自带冲突感与故事性,更容易激发公众的讨论欲;而技术开源的长期价值,往往需要在产业落地中逐步显现,难以形成即时的话题爆点。但从AI产业发展的底层逻辑看,Qwen3.5的开源意义远不止于发布一款产品,它标志着中国AI团队正在通过开放生态,加速小模型赛道的技术迭代与应用落地,为全球AI产业的多元化发展注入新动力。

58 分钟前
据科技媒体The Information爆料,OpenAI计划推出新一代大语言模型GPT-5.4,其上下文窗口容量将突破100万Tokens,较前代GPT-5.2的40万Tokens实现翻倍式提升。此外,GPT-5.4新增“极限推理模式”,可针对复杂问题分配更多计算资源,进一步强化模型推理能力,旨在缩小与谷歌、Anthropic竞品的上下文能力差距。

59 分钟前
近日,Meta正式组建应用人工智能工程部门,由现实实验室副总裁Maher Saba掌舵,直接向首席技术官Andrew Bosworth汇报。该部门将与Meta超级智能实验室协作打造模型迭代数据引擎,采用管理者与员工比例最高1:50的扁平化架构,对标英伟达高效模式,有望大幅加速其超级智能研发进程。

1 小时前
据内部知情人士透露,Meta正组建全新应用AI工程部门,由现实实验室副总裁Maher Saba领衔,直接向首席技术官Andrew Bosworth汇报。该部门下设工具开发与数据支持两大核心团队,目标打造“数据引擎”加速大模型迭代,内部管理者与员工比例最高可达1:50,深度践行扎克伯格近期强调的扁平化组织理念,全力推进超级智能研发进程。

1 小时前
字节火山引擎近日正式公布旗下多模态视频生成AI模型Doubao-Seedance-2.0的API服务定价,其中视频输入类(编辑)服务为28元/百万Tokens,纯视频生成服务为46元/百万Tokens。作为豆包大模型团队推出的新一代产品,Seedance 2.0支持图像、视频、音频等多模态输入,此次定价明确标志着其商业化落地的关键一步。

1 小时前
3月4日消息,韩媒披露特斯拉采购高管本周将赴韩拜访三星电子,磋商大幅提升其2nm工艺AI6芯片的产能规模。此前特斯拉向三星晶圆代工的月投片量约1.6万片晶圆,当前额外需求达2.4万片。作为特斯拉定位的通用型AI芯片,AI6可支撑其电动车、人形机器人及数据中心等多元业务的算力需求。

1 小时前
Reddit用户RatonVaquero所属的软件开发公司因谷歌Gemini API密钥被盗,48小时内产生超8.2万美元的天价使用费用,远超其每月180美元的常规开销。该开发者指责谷歌缺乏异常消费冻结、消费上限等防护机制,目前已向FBI报案,寄望谷歌能基于善意减免费用,避免公司陷入破产危机。

1 小时前
继与美国国防部达成合作后,OpenAI正洽谈将AI技术部署至北约非机密网络。CEO山姆·奥尔特曼坦言此举短期内可能引发品牌危机,但仍认为是“复杂但正确的决定”。其竞争对手Anthropic此前因反对AI用于大规模监控和自主武器,已终止与美国国防部的合作。

1 小时前
前Meta研究工程师在被公司裁员后,发起了一场极具趣味性的编程实验:让小狗随机敲击键盘生成无逻辑乱码,再借助Anthropic的大语言模型Claude,将这些乱码转化为可正常运行的网页小游戏,目前已将项目代码全面开源,为AI辅助创意编程领域提供了荒诞却极具启发的新实践。