5月16日,NVIDIA正式发布开源世界模型SANA-WM,这款仅2.6B参数规模的模型,首次实现单GPU硬件条件下生成分钟级720P分辨率的视频内容,突破了传统视频生成模型对算力集群的依赖。这一成果为AI内容创作、虚拟场景构建等领域大幅降低了落地门槛,标志着AI世界模型在轻量化、实用化方向取得关键突破。
在AI视频生成赛道,算力瓶颈长期制约技术落地。过往主流模型虽能生成高分辨率长视频,但动辄百亿级参数的规模,需依赖多GPU集群支撑,研发和应用成本居高不下——中小团队及个人开发者难以负担百万级的算力投入,导致AI视频生成技术始终局限于大厂的实验室中,难以向垂直场景普及。行业对轻量化、低门槛的视频生成模型需求迫切,NVIDIA的技术突破恰好击中这一市场核心痛点。
2.6B参数规模是SANA-WM最具竞争力的标签:相较于行业内动辄百亿级参数的竞品,其轻量化体量不仅降低了训练和部署成本,更实现了算力效率的飞跃。该模型可在单张消费级GPU上稳定生成时长超1分钟、分辨率达720P的连贯视频,无需依赖多节点算力集群,这意味着个人开发者、小型工作室也能快速搭建AI视频生成的实验环境。作为开源项目,SANA-WM的权重将向全球社区开放,进一步激发开发者的创新潜力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
5 分钟前
2026年5月,河北辛集市果农张先生在某直播电商平台开设新店售卖自家培育的无花果苗,仅完成12笔订单就遭遇恶意“仅退款”申请。买家附AI伪造的树苗枯黄照片索赔,张先生凭20年种植经验识破造假,但其自证后,平台仍在数分钟内秒批申请,张先生无奈宣布退店,此事引发对电商平台AI仲裁漏洞的广泛关注。

7 分钟前
近期,滑铁卢大学与伦敦大学学院科研团队在《通讯·心理学》期刊发表研究,揭示了一种名为“自信错觉”的认知偏差:即使AI与人类给出完全一致的答案,人们仍普遍认定人工智能作答时的自信水平更高。该研究指出,当无法直接判断对方确信程度时,人们倾向于通过作答速度等线索高估AI自信,这一偏差可能影响日常决策中对AI建议的接受度。

9 分钟前
2026年5月18日,搜狐CEO张朝阳在2026搜狐科技论坛上正式披露搜狐AI战略:公司未入局当前互联网行业热炒的“千亿参数大模型研发第一阵营”,而是选择避开激烈的“大模型军备竞赛”,将资源集中于基于自身业务基础的理性AI应用落地,这一务实策略为中型科技企业在生成式AI热潮中的发展提供了新的参考样本。

12 分钟前
5月18日,百度发布2026年第一季度财报,总营收321亿元超市场预期,AI业务成增长核心:AI云收入88亿元同比大涨79%,GPU云收入实现184%爆发式增长。期内百度智能云升级为面向大规模智能体应用的全栈AI云,蝉联智能云行业中标双料冠军;昆仑芯P800交付万卡集群支撑文心大模型训练,天池256卡超节点定于6月上市。

16 分钟前
知名快餐品牌必胜客近期陷入法律纠纷,其美国头部加盟商查克东北披萨公司正式起诉品牌方,控诉必胜客强制引入的AI配送管理平台“龙尾”(Dragontail),导致该加盟商旗下111家门店运营混乱,业绩大幅下滑,索赔金额超1亿美元。此前该加盟商超九成外卖订单可在30分钟内送达,系统上线后却因骑手囤单引发大规模配送延迟,相关业务亏损已超出预期。

17 分钟前
2026年5月18日,Linux创始人林纳斯·托瓦兹在发布新版Linux内核时,对人工智能工具的滥用发出严厉警告:大量AI生成的重复错误报告正严重堵塞内核安全呈报通道,给核心维护者带来难以承受的无效工作负担。托瓦兹强调,他并非完全禁止在开发中使用AI,而是痛斥低门槛提交方式导致的同质化报告泛滥,这一问题已极大干扰了开源项目的正常维护节奏。

19 分钟前
近期,针对医学、法律、金融等垂直专业领域定制的21款大语言模型(LLMs)陆续推出,这类模型跳出通用大模型的泛化局限,通过专项领域数据训练强化专业知识的深度与精准度,为医疗辅助、法务咨询、金融风控等场景提供定制化解决方案,标志着大模型从“通用智能”向“垂直深耕”的关键转型。

22 分钟前
5月18日,NVIDIA正式公布面向大语言模型预训练的全新4位精度技术方案NVFP4。该方案通过前沿架构模型完成可行性验证:基于120亿参数的混合Mamba-Transformer模型,在累计处理10万亿token数据的基准场景下,NVFP4将预训练阶段的显存占用大幅压缩,同时未显著损失模型性能,为大模型训练的成本控制提供突破性路径,填补了低位精度预训练在混合架构领域的实践空白。