neo-ai是一款基于Neodomain AI API开发的开源AI生成工具,由开发者@bandwhite推出,核心定位是为用户提供轻量化的多模态内容生成入口,可实现图像、视频类AI内容的快速生成。该工具遵循MIT-0开源许可协议,允许用户自由使用、修改和分发源码,无需强制标注来源,相比闭源的同类AI生成工具,它更适合有二次开发需求的开发者灵活调用,适配各类需要嵌入AI生成能力的项目,整体使用门槛低,安全合规性有保障。
neo-ai依托Neodomain AI API实现生成能力,可输出满足不同需求的多类生成成果:在图像生成场景,可根据文本描述生成对应风格、主题的定制化图像,适配不同创作主题的需求;在视频生成场景,支持静态图像转动态视频、文本直接生成视频,还可实现带运动控制的定向视频生成,生成的视频画面逻辑连贯,可满足基础内容创作的输出要求;通用多模态视频生成可适配多种输入格式,满足跨模态内容转换的多样化需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
4 小时前
2026年4月,腾讯混元团队正式开源面向少步蒸馏视频生成模型的加速方案DisCa,该方案通过可学习特征缓存技术突破传统缓存方案的误差瓶颈,在保证生成质量的前提下,实现最高11.8倍的推理加速,相关成果已被国际计算机视觉顶会CVPR 2026收录,目前完整代码与模型权重已对外开放供行业开发者测试使用。

1 天前
2026年4月,微软正式发布旗下旗舰图像生成模型MAI-Image-2的升级版本MAI-Image-2-Efficient,该模型面向企业级应用场景,主打低成本与高效能优势,生成速度较前代提升22%,整体效率提升4倍,整体成本降低41%,每百万文本输入成本仅5美元,每百万图像输出成本19.5美元,性价比远超行业同类顶级模型。

13 天前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

15 天前
2026年4月1日,阿里正式推出图像生成与编辑统一大模型Wan2.7-Image,该模型突破传统AI生图同质化、指令对齐难的行业痛点,支持从骨相到五官细节的像素级捏脸,搭载调色盘风格迁移功能,最高支持3K token文本输入,可稳定输出含公式、表格的印刷级图文内容,大幅提升了AI生图的个性化程度与专业场景适配能力。

15 天前
2026年4月1日,字节跳动正式启动Seed2027届大模型人才校园招聘计划,面向全球2027届本、硕、博毕业生开放正式校招及实习岗位,覆盖大语言模型、多模态理解与生成、大规模分布式训练等前沿AI方向,入选者可接触核心算力资源、获得资深科学家指导,是字节深耕大模型底层技术的重要人才布局举措。

23 天前
美国AI初创公司Luma Labs于2026年3月23日正式推出首款公开图像生成模型Uni-1,该模型基于Unified Intelligence架构打造,放弃主流扩散模型路线,采用decoder-only自回归Transformer架构实现文本与像素同步生成,可消除传统两阶段生成的信息损耗。目前产品已开放免费试用,API定价同步公布,企业接入通道将逐步上线。

27 天前
2026年3月20日,微软AI首席执行官穆斯塔法·苏莱曼正式推出第二代图像生成模型MAI-Image-2。该模型在权威生图评测榜单LMArena中位列全球第三,仅次于谷歌Gemini-3.1-flash-image-preview与OpenAI GPT-image-1.5-high-fidelity...

1 个月前
OpenAI正为ChatGPT网页端测试多项深度更新,核心功能为开发者Tibor Blaho泄露测试界面中的“写作模板”——用户可上传个人文档作为样本,系统将自动提取其语言风格、结构习惯生成定制化模板,同时平台还在推进多模态联动等升级,旨在降低AI生成内容的机械感,推动生成式AI向个性化、专业化方向发展。