2026年4月3日,阿里通义实验室正式发布视频创作大模型Wan2.7-Video,该模型支持文本、图像、视频、音频全模态输入,可实现从画面结构、局部细节到时序剧情的多维度编辑,用户仅需输入自然语言指令即可完成捏脸、换角色、改剧情等操作,同时自动保持光影材质一致性,大幅降低专业视频创作门槛。
很多内容创作者都有过“废片拯救”的痛点:精心拍摄的vlog出现表情崩坏的画面、剧情走向不符合预期、想要更换片中角色却要付出数小时的剪辑成本,甚至只能重拍。这类需求如今有了更高效的解决方案。
此前市面上的视频大模型大多聚焦文生视频、图生视频的生成能力,针对已有视频的编辑功能普遍存在精度不足、时序混乱、穿帮频发等问题:局部修改后光影材质与原片脱节,调整剧情后前后片段逻辑无法自洽,复杂的操作门槛也让普通用户望而却步。随着短视频、内容创作行业的规模持续扩大,市场对低门槛、高精度的视频编辑工具的需求正在快速攀升。
本次发布的Wan2.7-Video核心能力恰好瞄准了上述痛点,其支持全模态输入,用户可搭配文字、图片、音视频等多种素材给出编辑指令。
不同于传统AI编辑工具的“改完就穿帮”问题,该模型会在编辑过程中自动匹配原片的光影、材质、运镜风格,哪怕是替换角色、调整人物表情这类局部修改,也能做到与原片毫无违和感。
此外,模型首次搭载了视频续写与尾帧控制联合机制:用户既可以基于现有片段自动续写后续内容,也能直接指定最终结尾的画面效果,模型会自动生成衔接流畅的中间内容,实现“定头定尾出内容”的创作效果。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 小时前
近期Meta、微软、谷歌等海外头部科技企业相继公布天然气电厂建设计划,为旗下高速扩张的AI数据中心提供稳定电力支撑。随着生成式AI普及,单座AI算力中心能耗是传统数据中心的3-5倍,现有公共电网已难以满足企业爆发式算力供电需求,化石能源供电方案也引发了业内对碳目标达成、长期运营风险的广泛讨论。

2 小时前
据科技媒体The Information及行业分析师Eric Newcomer披露,AI大模型厂商Anthropic已于近期完成对秘密运营的生物科技AI初创公司Coefficient Bio的收购,本次交易为全股票形式,总对价达4亿美元。这是Anthropic首次落地生命科学垂直领域布局,也标志着大模型厂商商业化正加速向生物医药赛道渗透。

2 小时前
2026年以来,微软、Meta、Google等全球科技巨头先后启动配套天然气发电厂建设项目,以满足AI大模型训练、推理所需的超算数据中心爆发式增长的能耗需求。行业测算显示,头部AI算力集群的单位能耗是传统数据中心的5-10倍,这一能源布局已引发行业关于碳排放、长期能源结构合理性的广泛讨论。

2 小时前
近期Anthropic源代码泄露事件中,安全研究者发现针对其旗下代码大模型Claude Code的新型prompt逃逸攻击路径,可绕过内容安全审查执行违规操作,而该类漏洞此前Anthropic公开表示已完成修复。目前该漏洞可导致代码生成环节出现恶意植入、数据泄露等风险,Anthropic尚未就新漏洞给出官方回应。

3 小时前
2026年4月3日,千问App正式上线万相2.7(Wan2.7)视频生成大模型,新增视频编辑、视频续写、动作模仿三大核心功能。用户仅通过自然语言指令即可完成角色替换、风格切换、镜头调整等操作,支持将2秒原始素材最长续写至15秒,大幅降低专业视频创作的技术门槛。

3 小时前
美国科技媒体Digital Trends近期发布的行业调查显示,全球已有超6成大中型保险公司引入AI系统负责核保风控、理赔核查等核心业务环节。美国消费者权益组织2024年调研数据显示,37%的拒赔案例由AI算法单独判定,其中42%存在事实认定偏差,相关算法决策的公正性问题已引发多国监管部门重点关注。

3 小时前
2026年4月3日,全球人工智能头部企业OpenAI宣布完成对美国科技访谈节目运营商TBPN的收购。据英国《金融时报》知情人士披露,本次收购对价达小几亿美元,标的团队仅11人,2025年全年营收达3000万美元。本次交易是OpenAI强化对外传播能力、重塑公众叙事体系的核心战略布局,也是2026年开年以来AI领域金额最高的内容生态类收购案。

14 小时前
2026年4月3日,美团技术团队正式发布原生多模态大模型LongCat-Next,该产品依托自主研发的DiNA(离散原生自回归)架构,突破传统“语言基座+插件”的拼凑式架构局限,实现图像、语音、文本的同源离散Token转化,视觉分词器压缩比达28倍,可原生实现对物理世界的“看”“听”能力,为多模态大模型发展提供了新的技术路径。