Gemini 3是由Gemini爱好者社区独立维护的多模态AI服务平台,与谷歌等品牌无官方关联,核心定位为整合前沿大模型能力的一站式AI创作服务入口。平台支持调用Google Gemini 3 Pro、Flash两款对话模型,同时搭载Veo3.1、Sora 2 Pro视频生成、Nano Banana Pro 4K图像生成能力。对比同类主流大模型,其1M tokens超大上下文窗口、81%的多模态任务得分、72.7%的抽象推理能力均处于行业领先水平,可满足多场景的AI交互与内容创作需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 天前
2026年4月披露的最新规划显示,微软正全面推进AI自主化战略转型,计划2027年推出自研尖端多模态大模型,实现文本、图像、音频处理能力全行业领先,直接对标OpenAI、Anthropic等头部厂商。为支撑该计划,微软已启动英伟达GB200芯片集群部署,未来12-18个月算力将大幅提升,同时仍将维持多元化AI生态布局。

2 天前
2026年4月,微软披露最新AI战略规划,由公司AI业务负责人苏莱曼牵头推进自研大模型研发,计划2027年前在文本、图像、音频处理能力上达到全球领先水平,打破长期以来对OpenAI等外部合作伙伴的技术依赖。目前微软正大规模部署英伟达GB200芯片集群,首批自研语音转录模型已在11种语言任务上超越行业同类产品。

2 天前
美国科技巨头微软于2026年4月推出三款全新基础大模型,上述产品由微软旗下成立仅6个月的MAI团队研发,覆盖语音转文字、音频生成、图像生成三大核心能力,直指当前多模态AI赛道主流竞品,旨在进一步扩大微软在全球生成式AI市场的话语权,与OpenAI、谷歌DeepMind等厂商展开直接竞争。

2 天前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

4 天前
2026年4月1日,阿里正式推出图像生成与编辑统一大模型Wan2.7-Image,该模型突破传统AI生图同质化、指令对齐难的行业痛点,支持从骨相到五官细节的像素级捏脸,搭载调色盘风格迁移功能,最高支持3K token文本输入,可稳定输出含公式、表格的印刷级图文内容,大幅提升了AI生图的个性化程度与专业场景适配能力。

11 天前
2026年3月23日,AI创意企业智象未来正式发布旗下首个多模态原生应用HiDreamClaw(内部代号“龙虾”),产品目前已接入其个人创意平台vivago web端,率先向海外用户开放。该产品深度兼容自研AIGC能力与OpenAI Sora、Google Veo等全球顶尖模型,标志着企业全流程AI创意生态布局完成关键落地。

12 天前
美国AI初创公司Luma Labs于2026年3月23日正式推出首款公开图像生成模型Uni-1,该模型基于Unified Intelligence架构打造,放弃主流扩散模型路线,采用decoder-only自回归Transformer架构实现文本与像素同步生成,可消除传统两阶段生成的信息损耗。目前产品已开放免费试用,API定价同步公布,企业接入通道将逐步上线。

13 天前
2026年3月23日,字节跳动旗下AI视频生成模型Seedance 2.0正式全球上线。该模型采用多模态统一架构,支持文本、图像、音频、视频多类输入,可生成1080P高保真原生同步音视频。在第三方机构Artificial Analysis的独立盲测中,其文本生成视频赛道以Elo 1269分登顶,力压OpenAI Sora、Google Veo3等头部竞品。