2026年3月13日,OpenAI正式向Sora视频生成API推送基于Sora2模型的重要更新,共推出五大核心能力升级,重点覆盖角色一致性支持、最高20秒生成时长、横竖屏双输出等功能,可解决批量视频生产中常见的角色视觉漂移、片段拼接断层等问题,大幅降低广告、短剧等规模化内容制作的后期成本。
对于不少依赖AI生成视频的内容团队而言,过去两年最大的痛点从来不是“做不出内容”,而是“做不出统一的系列内容”:同一主角在不同镜头里五官漂移、服化道穿帮,单条生成时长不够只能反复拼接导致风格跳脱,不同平台分发需要重复生成横竖屏版本,大量时间成本被耗在后期修正上,远达不到工业化生产的标准。
随着竖屏短剧、品牌效果广告、系列科普内容的线上流量需求爆发,AI生成视频早已从创意圈的尝鲜工具,变成了不少内容团队的标配生产工具。据第三方调研机构数据,2025年国内使用AI生成视频的内容团队占比已达68%,但其中72%的团队都提到“角色一致性不足”是限制其规模化生产的核心阻碍,部分短剧团队的后期修图成本甚至占到总制作成本的40%,直接抵消了AI工具带来的效率优势。
本次Sora2 API的更新,几乎所有功能都精准指向了规模化生产的核心需求。
最受关注的角色一致性功能,允许开发者提前上传或定义包含角色面部特征、服装、配饰等信息的专属“档案”,模型在生成多段视频时会自动复用该参考标准,跨场景的角色匹配准确率可达92%以上,直接砍掉了大部分后期修脸、统一服化道的工作,尤其适合需要固定主角贯穿的短剧、系列广告等场景。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
12 小时前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

14 小时前
2026年5月15日,人工智能企业OpenAI宣布将旗下代码生成模型Codex正式集成至iOS、Android双端ChatGPT移动应用,面向全球开发者提供移动端远程编码管理能力。目前Codex周活跃用户已突破400万,本次更新打破办公场景限制,支持多开发环境实时同步,开发者可利用碎片时间处理紧急代码需求。

14 小时前
2026年5月,OpenAI正式宣布将AI编程模型Codex集成至ChatGPT的iOS及Android移动端应用。本次更新针对手机使用场景做了专属交互适配,支持开发者在通勤、线下休闲等非办公场景快速完成代码审批、逻辑调试等碎片化编程任务,标志着AI编程工具正式从桌面生产力阶段迈入全时伴随的发展新阶段。

14 小时前
创新工场董事长李开复近日在专访中阐释“AI主权”概念,其涵盖技术控制权、数据安全、本土文化法律适配三大核心维度。他明确指出各国无需盲目复刻闭源巨头OpenAI的发展路径,资源有限的市场主体可依托开源模型走本地化建设的“第三条路”,中国企业DeepSeek已验证该模式可实现不到美国同行十分之一的投入达标同等性能。

15 小时前
2026年5月,距OpenAI GPT-5.5正式发布仅三周,该公司被曝已启动GPT-5.6内部测试,首批内部检查点已完成首轮测试,预计下月正式亮相,内部代号为ember-alpha与beacon-alpha,相关调用记录已出现在OpenAI Codex日志中。同期OpenAI与竞争对手Anthropic同步推出开发者补贴政策,大模型行业技术迭代与商业化竞争同步升级。

15 小时前
2026年5月,全球AI技术测评团队完成了面向软件开发场景的AI Agent专项基准测试,本次测试覆盖市面上17款主流商用、开源AI Agent产品,覆盖代码生成、漏洞修复、架构设计三大核心开发场景,DeepSeek Dev Agent、OpenAI GPT-4o Coding Agent、Code...

15 小时前
近期,由北美多所高校联合AI安全实验室发布的最新研究显示,当前OpenAI GPT-4o Computer Use、谷歌Gemini Advanced、微软Copilot等主流可操作电脑的AI代理产品,在处理整理表格、筛选邮件等常规办公任务时平均成功率仅为22%,超6成测试案例出现操作偏差,11%的案例发生不可逆错误,远未达到厂商宣传的商用标准。

15 小时前
近日有行业动向显示,科技巨头谷歌正在筹备推出性能大幅升级的新一代Gemini大模型,目标直指OpenAI旗下核心产品ChatGPT的现有市场优势。据第三方机构预估,新版Gemini将在多模态理解、逻辑推理、长上下文处理等核心指标上实现15%-30%的性能提升,有望打破当前全球消费级大模型市场的现有竞争格局。