网站截图
Gemini Gen AI是一款基于Google Gemini大模型的多模态AI生成工具,核心解决“创意内容生成效率低、多场景需求适配不足”的痛点。平台整合文生图、文生视频、文本生成等多元功能,支持高分辨率输出与多风格定制,适配短视频素材创作、设计物料制作、创意原型生成等多场景,同时提供清晰的商用授权规则,成为全球创作者高效获取创意内容的核心工具。
短视频创作中,输入文案即可生成专属素材(如产品展示视频、场景化画面),搭配平台风格定制功能,快速产出系列化内容;设计场景下,生成海报背景、插画元素,节省素材制作时间;营销人员可通过文生视频功能快速制作产品宣传短片、活动预热视频,适配社交平台传播;创意从业者可借助多模态输入功能,将草图转化为高清成品,激发创作灵感;自媒体人可生成个性化配图、短视频片段,提升内容视觉吸引力与更新频率。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
6 小时前
2026年5月,AI多模态初创企业智象未来在首届开放日正式推出基于Unified Transformer(UiT)原生架构打造的HiDream-O1-Image-Pro图像大模型,参数规模突破2000亿,核心任务表现达到行业顶尖水平。与此同时,企业官宣两周内连续完成两轮亿级融资,投资方覆盖深创投、金浦投资等头部机构,资金将全部投入全模态技术研发与场景落地。

6 小时前
谷歌近日面向全球YouTube用户推送AI能力更新,全量接入自研多模态大模型Gemini Omni,普通用户可免费使用基础AI服务,但核心的跨视频语义检索、多模态内容溯源等高级AI搜索功能,目前仅向订阅YouTube Premium的付费用户开放,覆盖全球超20亿月活用户。

5 天前
消费电子巨头三星已启动旗下首款AI智能眼镜的量产筹备工作,该产品正式命名为Galaxy Glasses,预计2025年7月面向全球市场发售。作为三星布局空间计算与生成式AI交互场景的核心硬件,Galaxy Glasses将搭载多模态AI交互系统,可实现独立语音交互、实时翻译、AR内容显示等功能,有望重构消费级可穿戴设备的使用场景。

19 天前
2026年5月OpenAI正式推出多模态图像生成工具ChatGPT Images2.0,Sensor Tower数据显示该功能发布首周ChatGPT全球下载量环比上涨11%,核心参与指标增幅约1%,印度以500万次首周下载量成为最大增量市场,远超美国的200万次,巴基斯坦、越南等新兴市场下载量增幅也达79%。

21 天前
2026年4月29日公开的SuperCLUE最新文生图模型评测结果显示,OpenAI于4月21日上线的新一代文生图模型GPT Image 2,正式超越谷歌此前的榜首产品Nano Banana2登顶全球第一。该模型在画质、指令理解、细节还原维度均实现突破,尤其汉字生成板块获93.07分、文字准确度满分,解决了海外模型汉语文本生成的长期痛点。

23 天前
2026年4月27日,阿里千问APP正式开启自研视频生成模型HappyHorse的灰度测试。该模型主打剧情类视频生成能力,在内测阶段已展现出突出的叙事逻辑、音画同步精度与风格还原能力,支持用户通过文字提示一键生成TVB港风、老版三国风、经典老电影风等多种风格的剧情短片,目前已有大量创作者产出趣味UGC内容分享至平台社区。

27 天前
2026年4月,OpenAI旗下AI绘图模型GPT Image2凭借出众生成效果引发全球科技圈关注,其幕后核心团队首度曝光:仅13名成员,耗时4个月完成底层架构彻底重写,项目负责人陈博远将其定义为“图像领域的GPT”,实现通用性大幅突破。陈博远此前为Sora核心研发成员,曾在Google参与Gemini 2.0相关技术开发。

29 天前
近日OpenAI正式推出ChatGPT Images 2.0图像生成工具,相较上一代版本,其在画面写实度、细节还原度、指令遵循度等核心指标上均提升超40%,支持多主体复杂场景生成、风格精准复刻、多轮修改等多项新功能,目前已向所有ChatGPT Plus及企业版用户开放,被业内视为AI图像生成赛道的标志性迭代。