跃问AI是阶跃星辰(StepFun)打造的多模态智能助手,依托Step系列自研大模型(含万亿参数MoE架构模型)构建核心能力,聚焦轻量化智能交互。其诞生于国内“百模大战”背景,团队由原微软全球副总裁等行业资深人士领衔,以“多模理解与生成统一”为技术方向,既服务个人创作者日常需求,也通过开源生态与API对接企业场景,目前已支撑茶百道智能巡检、AI应用“胃之书”等多个落地案例。

10 小时前
2026年4月披露的最新规划显示,微软正全面推进AI自主化战略转型,计划2027年推出自研尖端多模态大模型,实现文本、图像、音频处理能力全行业领先,直接对标OpenAI、Anthropic等头部厂商。为支撑该计划,微软已启动英伟达GB200芯片集群部署,未来12-18个月算力将大幅提升,同时仍将维持多元化AI生态布局。

13 小时前
2026年4月,微软披露最新AI战略规划,由公司AI业务负责人苏莱曼牵头推进自研大模型研发,计划2027年前在文本、图像、音频处理能力上达到全球领先水平,打破长期以来对OpenAI等外部合作伙伴的技术依赖。目前微软正大规模部署英伟达GB200芯片集群,首批自研语音转录模型已在11种语言任务上超越行业同类产品。

21 小时前
美国科技巨头微软于2026年4月推出三款全新基础大模型,上述产品由微软旗下成立仅6个月的MAI团队研发,覆盖语音转文字、音频生成、图像生成三大核心能力,直指当前多模态AI赛道主流竞品,旨在进一步扩大微软在全球生成式AI市场的话语权,与OpenAI、谷歌DeepMind等厂商展开直接竞争。

22 小时前
近日谷歌正式为旗下轻量视频创作工具Google Vids推送重大AI功能更新,本次升级依托Google Gemini大模型底层能力,新增脚本自动生成、素材智能匹配、一键风格转译等多项实用功能,可将普通用户的视频制作耗时缩短最高达70%,无需专业剪辑基础即可完成商宣、科普、生活记录等多品类短视频制作。

4 天前
2026年3月,微软正式开源前沿语音AI模型家族VibeVoice,该模型同时覆盖自动语音识别(ASR)与文本转语音(TTS)两大场景,可单次处理最长90分钟的多说话人对话,具备实时低延迟特性。项目上线GitHub后迅速引发全球开发者关注,目前已收获27K Star,采用MIT许可协议,支持本地免费部署,旨在推动语音AI领域的协作开放创新。

9 天前
2026年3月23日,AI创意企业智象未来正式发布旗下首个多模态原生应用HiDreamClaw(内部代号“龙虾”),产品目前已接入其个人创意平台vivago web端,率先向海外用户开放。该产品深度兼容自研AIGC能力与OpenAI Sora、Google Veo等全球顶尖模型,标志着企业全流程AI创意生态布局完成关键落地。

11 天前
2026年3月23日,字节跳动旗下AI视频生成模型Seedance 2.0正式全球上线。该模型采用多模态统一架构,支持文本、图像、音频、视频多类输入,可生成1080P高保真原生同步音视频。在第三方机构Artificial Analysis的独立盲测中,其文本生成视频赛道以Elo 1269分登顶,力压OpenAI Sora、Google Veo3等头部竞品。

15 天前
2026年3月财报沟通会上,腾讯正式披露自研大模型混元3.0最新进展:该模型目前已进入内部业务测试阶段,计划2026年4月正式对外发布。作为混元系列重大迭代版本,其核心升级方向为从大模型向强智能体跃迁,推理能力为历代提升最大,多模态相关能力已落地微信、元宝等产品。