Janus Pro AI是Deepseek研发的新一代多模态大模型,是初代Janus的升级版本,通过优化训练策略、扩充训练数据集、扩大模型参数规模三大核心升级,在多模态理解、文生图指令遵循能力上实现大幅提升,同时文生图生成稳定性也得到显著优化。和专注文生图质量的Flux模型相比,Janus Pro AI具备双向跨模态交互能力,更适配需要文本、图像联动处理的复杂任务场景,目前所有核心功能均支持免费在线试用。
多模态理解场景下,上传含复杂公式的物理试卷截图,模型可准确识别图像内容并给出完整解题步骤、知识点拓展;文生图场景下,输入“赛博朋克风格的江南水乡夜景,水面漂浮荧光荷花,远处有悬浮列车驶过”的描述,可生成符合所有细节要求、风格统一的高清图像;代码交互场景下,可结合手绘的程序流程图截图,输出可直接运行的对应代码片段并附带注释说明。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
3 天前
X平台旗下由埃隆·马斯克主导研发的生成式AI工具Grok AI近期完成新一轮功能迭代,正式上线覆盖超100种语言的实时跨语言互译功能,同时新增自然语言提示词修图能力,用户仅需输入简单口语化指令即可完成滤镜调整、元素修改等复杂图像操作,目前两项功能已向所有X Premium订阅用户开放。

4 天前
2026年4月,国内大模型厂商DeepSeek旗下新一代基座模型DeepSeek V4开启灰度测试,本次升级覆盖底层架构、交互逻辑与多模态能力三大维度,推出快速版、专业版、视觉版三大分支,其中专业版疑似采用创始人梁文锋团队提出的全新记忆架构,视觉版本可支持图像、视频高精度分析任务。

7 天前
近期微软确认将加大自研AI模型投入,打破此前AI产品线核心能力主要依赖OpenAI技术的合作模式,旗下AI助手Copilot、Azure云AI服务将逐步接入自研大模型,与OpenAI GPT系列、谷歌Gemini系列形成直接竞争。本次自研模型覆盖通用对话、代码生成、多模态处理等场景,预计2025年上半年完成核心产品线适配。

9 天前
2026年4月3日,广汽本田面向纯电车型P7正式推送智导互联4.2.2系统OTA升级,核心升级为全面接入AI大模型,新增支持用户自定义的“声音复刻”功能。升级后车型座舱交互能力大幅提升,可实现旅行攻略自动生成、用车问题智能答疑、自然多轮对话等能力,标志着本田在华纯电车型正式进入大模型原生驱动新阶段。

9 天前
2026年4月3日,小米正式官宣为旗下MiMo大模型推出首个Token订阅套餐,共设Lite、Standard、Pro、Max四档,定价从39元/月到659元/月不等,面向开发者及AI深度兴趣群体提供服务,任意档位订阅均可解锁MiMo家族三大核心模型的调用权限,此举标志着小米AI生态正式进入商业化付费阶段。

9 天前
2026年4月披露的最新规划显示,微软正全面推进AI自主化战略转型,计划2027年推出自研尖端多模态大模型,实现文本、图像、音频处理能力全行业领先,直接对标OpenAI、Anthropic等头部厂商。为支撑该计划,微软已启动英伟达GB200芯片集群部署,未来12-18个月算力将大幅提升,同时仍将维持多元化AI生态布局。

9 天前
2026年4月,微软披露最新AI战略规划,由公司AI业务负责人苏莱曼牵头推进自研大模型研发,计划2027年前在文本、图像、音频处理能力上达到全球领先水平,打破长期以来对OpenAI等外部合作伙伴的技术依赖。目前微软正大规模部署英伟达GB200芯片集群,首批自研语音转录模型已在11种语言任务上超越行业同类产品。

9 天前
美国科技巨头微软于2026年4月推出三款全新基础大模型,上述产品由微软旗下成立仅6个月的MAI团队研发,覆盖语音转文字、音频生成、图像生成三大核心能力,直指当前多模态AI赛道主流竞品,旨在进一步扩大微软在全球生成式AI市场的话语权,与OpenAI、谷歌DeepMind等厂商展开直接竞争。