书生是商汤科技打造的多模态通用大模型平台,依托商汤在计算机视觉、自然语言处理等领域的技术沉淀,构建了覆盖文本、图像、语音等多模态的AI能力矩阵。平台以“智启百业”为核心定位,为个人用户提供日常办公、内容创作、代码开发等便捷AI工具,为企业客户定制适配行业场景的智能化解决方案,推动各领域的数字化转型。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
5 小时前
近日谷歌推出Gemini大模型的全新个性化生图功能,该功能可在获得用户主动授权后访问谷歌相册中的历史照片,分析用户的构图、色彩、风格等审美偏好,生成符合用户个人品味的定制化图片。内部测试数据显示,该功能生成图片符合用户预期的比例较通用生图模式提升62%,目前已向所有Gemini高级订阅用户开放使用。

5 小时前
2026年4月披露的信息显示,AI初创公司Thinking Machines资深工程师Joshua Gross已正式加入Meta超级智能实验室并领导工程团队。Gross此前主导开发了该公司旗舰多模态创意生成工具Tinker,截至目前Meta已从该公司挖走5名创始成员,OpenAI也挖走其2名核心高管,硅谷AI领域头部企业与创企间的人才争夺正持续升温。

8 小时前
2026年4月16日,AI大模型企业Anthropic深夜发布新一代旗舰大模型Claude Opus 4.7。相较前代产品Opus 4.6,该模型在复杂软件工程任务、高分辨率图像处理、超长任务处理及自主校验能力上均有显著提升,其中高分辨率图像处理能力达此前Claude系列模型的3倍以上,配套的Claude Code工具也同步完成迭代。

1 天前
2026年4月16日,阿里巴巴旗下ATH团队正式推出全新开放世界交互AI模型Happy Oyster,目前已开放早期用户体验申请。该模型是团队继视频生成模型HappyHorse之后的新作,标志阿里AI技术布局从静态视频生成正式延伸至交互式开放世界赛道。此前权威评测平台LM Arena数据显示,HappyHorse-1.0以1299分Elo评分登顶视频编辑方向全球榜首,超越Grok等国际主流模型。

7 天前
2026年4月10日,大模型企业MiniMax正式发布新一代AI音乐生成模型Music 2.6,本次升级覆盖底层引擎到前端创作工具全维度,不仅实现生成延迟大幅降低、音乐结构连贯性、声学质感显著提升,还首次上线Cover翻唱功能与AI Agent创作技能,为创作者提供更精准流畅的音乐生成体验,拓宽AI音乐交互边界。

8 天前
X平台旗下由埃隆·马斯克主导研发的生成式AI工具Grok AI近期完成新一轮功能迭代,正式上线覆盖超100种语言的实时跨语言互译功能,同时新增自然语言提示词修图能力,用户仅需输入简单口语化指令即可完成滤镜调整、元素修改等复杂图像操作,目前两项功能已向所有X Premium订阅用户开放。

9 天前
2026年4月,国内大模型厂商DeepSeek旗下新一代基座模型DeepSeek V4开启灰度测试,本次升级覆盖底层架构、交互逻辑与多模态能力三大维度,推出快速版、专业版、视觉版三大分支,其中专业版疑似采用创始人梁文锋团队提出的全新记忆架构,视觉版本可支持图像、视频高精度分析任务。

10 天前
2026年4月7日,美图公司旗下AI Agent产品RoboNeo正式接入Seedance2.0大模型,完成AI短视频创作从“单点生成”到“系统化工作流”的升级。用户可直接调用文生视频、图生视频、首尾帧控制、视频参考生成等能力,自由组合创作逻辑,有效解决AI视频生成的片段化痛点,推动视频生产向工业化落地阶段迈进。