VideoAny是一款主打免费、无审查的全链路AI视频创作工具,内置AI图像、AI音频生成能力,覆盖从素材生成到视频制作的全流程需求。平台搭载了Kling 3、Grok Imagine、Vidu Q3、Sora 2等数十款主流AI视频模型,还上线了60+专属AI视频特效,可满足不同风格的视频创作需求。和同类AI视频工具相比,VideoAny无内容审查限制,创作自由度更高,而且核心功能免费开放,无需高额付费即可产出高质量的动态视频、音频内容,适配个人创作者、小型内容团队的轻量化创作需求。
平台可实现多种高质量创作效果:静态图片输入后可生成带原生音频的高清动态视频,质感达到院线级 cinematic 效果;通过AI特效工具可实现静态人物照片跳舞、拥抱、亲吻等动态效果,适配情侣纪念、趣味内容创作需求;输入文本prompt即可生成匹配风格的完整视频内容,无需额外拍摄剪辑;还可实现视频提取音频、文本生成专属背景音乐等效果,输出内容可直接用于新媒体平台发布。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 个月前
2026年4月,腾讯混元团队正式开源面向少步蒸馏视频生成模型的加速方案DisCa,该方案通过可学习特征缓存技术突破传统缓存方案的误差瓶颈,在保证生成质量的前提下,实现最高11.8倍的推理加速,相关成果已被国际计算机视觉顶会CVPR 2026收录,目前完整代码与模型权重已对外开放供行业开发者测试使用。

1 个月前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

1 个月前
2026年4月2日,美团LongCat团队正式发布并开源端到端音频生成模型LongCat-AudioDiT,提供1B、3.5B两个参数版本。该模型首创波形潜空间直接建模架构,摒弃传统TTS系统的梅尔频谱中间表征,搭载全卷积设计的Wav-VAE可将24kHz波形压缩2000倍至11.7Hz帧率,大幅降低信息损耗与误差累积,成功刷新零样本音色克隆性能SOTA。

2 个月前
3月2日,阿里通义实验室正式发布Fun-CosyVoice3.5与Fun-AudioGen-VD两款语音大模型,首次支持FreeStyle自然语言指令交互,实现“一句话生成语音”的自由体验。其中Fun-CosyVoice3.5新增4个语种支持,通过强化学习技术将生僻字读错率从15.2%降至5.3%,首包延迟降低35%。

2 个月前
近日,谷歌全面重塑升级AI创意工作室Flow,整合原图像生成项目Whisk与ImageFX,搭载Nano Banana模型并新增套索工具等专业功能。自去年亮相以来,Flow已累计生成超15亿张图像与视频,目前已正式上线,用户可免费注册体验,3月起还能无缝迁移项目文件,专业用户另有付费方案可选。

10 小时前
2026年5月19日,蚂蚁集团自研的智能终端可信连接技术框架GPASS迎来新落地场景:搭载该技术框架的乐奇AI眼镜新版本正式上线城市伴游功能。作为杭州文旅、支付宝与乐奇联合打造的“镜游杭州”项目核心载体,首个文旅官方智能体“杭小忆”同步入驻,可实时为用户提供周边景点讲解、交互问答、导航等全链条服务。

10 小时前
北京时间2026年5月19日,大模型独角兽Anthropic正式宣布对旗下两款核心AI产品Claude Design、Claude Code完成重磅功能升级。本次调整覆盖Pro、Max、Team、Enterprise全量订阅套餐,将所有付费用户的Token使用上限直接翻倍,同时将Claude Code快速模式的底层模型默认切换为最新Opus 4.7,不加价的前提下大幅降低创作者与开发者的使用门槛。

10 小时前
2026年5月,亚马逊正式为其大模型重构的新一代语音助手Alexa+推出名为Alexa Podcasts的AI定制播客功能,该功能首批面向美国地区用户开放公测,用户仅通过一句简单语音指令,无需上传素材、编写脚本,即可在数分钟内获得完全匹配个人兴趣的专属播客内容,大幅拓展了消费级AI语音助手的落地边界。