2026年4月15日,小红书AI平台团队正式对外开源专为多模态与智能体场景打造的Relax大模型强化学习训练引擎。该引擎支持文字、图像、音频、视频全模态统一处理,通过模态感知并行、端到端异步流水两项核心机制优化训练效率,切入AI行业公认的多模态智能体核心赛道,打破了外界对小红书仅做内容社区的固有认知。
在多数人的认知里,小红书是国内头部内容生活社区,核心AI能力多用于内容推荐、图文生成这类应用层场景,很少有人会将它和AI底层训练引擎联系起来。这次Relax的低调开源,相当于把小红书在底层大模型训练领域的技术积累摆到了台前。
当前全球AI行业已经形成共识,多模态与智能体(Agent) 是接下来产业落地的核心方向。不同于早期单模态大语言模型只处理文本输入,多模态智能体需要同时调度图文音视频多种数据的训练与推理,对底层训练引擎的资源调度能力提出了远高于以往的要求。
过往多数开源训练引擎针对文本大模型优化,难以适配多模态场景的资源分配需求,常常出现算力浪费、训练效率低下的问题,这也是很多团队研发多模态模型的核心卡点。
针对多模态场景的痛点,Relax设计了两项核心技术机制解决行业共性问题。第一项是模态感知并行机制,引擎可以自动识别不同输入模态的计算特性,智能分配GPU等计算资源,避免不同模块之间算力分配不均的问题。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年4月16日英伟达正式推出3D场景生成系统Lyra2.0,可依托单张照片生成延展90米的高连贯性3D虚拟环境,攻克长距离相机路径下的图像失真痛点,基准测试中在图像质量、相机控制等维度优于GEN3C、Yume-1.5等6款竞品,快速版本生成效率提升13倍,将有效满足具身智能训练对高质量虚拟场景的迫切需求。

5 小时前
2026年4月17日,Google宣布为旗下AI开发平台Google AI Studio接入Google AI Plans订阅服务,正式打通AI开发工具与订阅服务壁垒。开发者可直接在平台内关联订阅获取更高使用限额、全栈多模态模型访问权限,同时平台新增按请求付费选项,可解锁所有模型与智能体的完整访问权,大幅降低开发者跨平台调用谷歌AI能力的操作成本。

6 小时前
2026年4月,人工智能基础设施初创公司Upscale AI被曝正推进成立7个月以来的第三轮融资,本轮拟募资1.8亿至2亿美元,目标估值20亿美元。该公司此前已完成1亿美元种子轮、2亿美元A轮融资,投资方包括老虎环球基金、Xora Innovation、Premji Invest等,核心方向为AI定制芯片及跨芯片通信基础设施研发。

6 小时前
2026年4月,人工智能企业OpenAI宣布全面升级旗下自动化编程工具Codex,新增后台运行、内置浏览器等核心功能,直接对标此前被多家企业选为首选AI编程工具的Anthropic旗下产品Claude Code,此举标志着全球头部AI厂商在AI编程细分赛道的竞争进入全新阶段,实用性、场景适配能力成为核心比拼维度。

6 小时前
2026年4月17日,OpenAI正式推出专为生物学研究场景深度训练的垂直领域大语言模型GPT-Rosalind,该项目由OpenAI生命科学产品负责人王昀昀主导,针对当前生物学研究中基因组数据过载、专业术语壁垒两大核心痛点,整合50种常见生物工作流及主流公共数据库访问能力,可有效降低跨领域研究门槛,推动生命科学研发效率提升。

6 小时前
2026年4月,AI企业Anthropic正就旗下尚未公开的新模型Mythos的使用授权,与美国联邦政府多部门展开磋商,合作范围覆盖财政部等核心机构。目前美国政府官员正推动白宫启动对该模型的测试,Anthropic方面称Mythos在网络安全漏洞识别领域能力远超现有版本,该合作意味着AI技术正加速渗透国家治理核心场景。

9 小时前
成立三年的美国AI初创公司Factory完成由Khosla Ventures领投的1.5亿美元新一轮融资,投后估值达到15亿美元。这家公司专注于研发面向大型企业的AI编码辅助工具,瞄准企业级开发效率升级的市场需求,本轮融资将用于技术研发和全球市场扩张,业内认为该赛道的资本热度印证了企业AI化对开发工具升级的迫切需求。

9 小时前
2026年4月17日,阿里通义千问团队正式发布旗下首个开源Qwen3.6系列混合专家(MoE)模型Qwen3.6-35B-A3B。该模型总参数量350亿,实际激活参数仅30亿,主打轻量高效特性,在编程、视觉两项核心能力上实现升级,视觉表现直逼Claude Sonnet 4.5,同时兼容OpenClaw开发框架,适配第三方智能体开发需求。