2026年5月22日,字节跳动AI研究团队正式对外开源原生统一多模态大模型Lance 3B,该产品仅搭载30亿激活参数,首次在轻量化级别的大模型体系中打破了传统VLM理解模型与DiT类扩散生成模型的技术边界,采用完全商用友好的Apache2.0开源协议开放全部权重,有望重塑当前多模态大模型的研发落地逻辑。
不少中小AI开发者近两年都有类似的痛点:想做一个同时支持视频内容解析和图文生成的小工具,动辄要同时对接两三个不同的大模型接口,不仅调用成本居高不下,多接口同步带来的逻辑延迟还经常拖垮产品体验。此前行业内始终没有低成本的解决方案,直到Lance 3B的开源才打破这一僵局。
过去两年多模态大模型的赛道发展始终陷入同质化误区,多数厂商为了在公开榜单上刷出好看的成绩,选择将图像理解、文生图、文生视频三类完全独立的专用模型,通过外层调度代码拼接成所谓的“全能多模态系统”。
这种“拼积木”式的方案存在天然缺陷:不同模型的架构、算子逻辑完全独立,推理过程中需要频繁切换计算资源,整体延迟比单模型高出30%以上,部署全栈功能至少需要数百GB显存支撑,普通消费级GPU根本无法承载,直接抬高了多模态应用的落地门槛。
和市面上的拼凑式产品不同,Lance 3B从预训练阶段就采用原生统一架构,所有任务共享同一套核心参数,相当于用同一个“大脑”同时处理多模态的理解、生成与编辑需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
6 小时前
全球科技巨头Meta近期正式启动基于生成式AI改造Facebook Groups的新项目,推出对标社区平台Reddit的全新兴趣社交产品。该产品集成Meta自研Llama 3大语言模型,首批灰度测试已经覆盖超过1.2亿原有Facebook群组活跃用户,主打AI驱动的内容自动化治理与兴趣匹配功能,意图抢占近年持续升温的垂直兴趣社区赛道。

7 小时前
近日Mozilla正式宣布旗下火狐浏览器将启动代号为Project Nova的大规模版本重构项目,计划于2026年下半年逐步向全量用户推送升级。本次升级围绕界面现代化、隐私控制、生产力三大方向优化,最核心的更新是设置页新增全局统一开关,用户可一键关停浏览器内置的当前及未来所有AI相关功能,进一步强化用户对数据隐私的自主控制权。

7 小时前
国内头部大模型厂商DeepSeek近期官宣累计融资额突破700亿元,管理层正式对外披露全新战略方向,不再将短期商业化收益作为核心考核目标,集中全部资源攻坚前沿AI技术,其中面向开发者的编程专属大模型DeepSeek Code已进入落地筹备阶段,相关配套的Agent Harness技术团队招聘工作也已全面启动。

7 小时前
近日,科技巨头Meta正式与美国肯塔基州布雷希特县学区达成和解,这是全美首例由学区发起的社交媒体青少年成瘾相关诉讼的和解结果。此前同案的YouTube、Snap、TikTok均已与原告达成协议,原告曾提出超6000万美元的15年心理健康专项赔偿要求,原定于6月12日开启的联邦庭审随之正式取消。

7 小时前
2026年5月,潮流电商平台得物公开其基于AI Coding工具Claude Code的数仓开发落地实践,团队在将重复性开发工作效率提升超40%的过程中,也定位到长对话上下文遗忘、规则执行稳定性不足两大核心痛点,实测数据显示AI生成SQL的数据偏差最高可达1000倍,为全行业企业级AI开发工具落地提供了极具参考性的真实样本。

7 小时前
2026年5月22日,OpenAI正式发布嵌入微软PowerPoint底层架构的ChatGPT for PowerPoint测试版插件,面向所有普通用户与ChatGPT Plus会员完全免费开放,支持一句话生成幻灯片、自动排查逻辑与格式错误等功能,直接打破传统PPT工具的创作效率瓶颈,是近期AI办公赛道最受瞩目的落地产品。

7 小时前
市场调研机构Comscore近期发布2026年3月美国桌面端消费级AI聊天机器人市场报告,数据显示当月全品类相关平台累计独立用户达4440万,环比增长超21%。OpenAI旗下ChatGPT以3386万独立访客稳居行业第一,Anthropic推出的Claude环比增速高达130%,正在快速缩小与头部产品的市场差距。

7 小时前
2026年5月最新披露的行业动态显示,微软正推进与生成式AI企业Anthropic的深度合作,计划向后者供应自研Maia 200专用AI芯片。微软CEO萨蒂亚·纳德拉公开表示,该芯片可实现每美元Token生成效率提升超30%,此前微软在专用AI芯片商用进度上长期落后于亚马逊与谷歌,本次合作将大幅加速自研芯片的落地验证进程。