抱歉,没有找到相关的全品类工具

2 小时前
2026年4月8日,阿里通义实验室Qwen Pilot团队正式推出全新推理优化算法FIPO,该算法突破传统强化学习在复杂逻辑推理场景的瓶颈,可将零基础训练模型的平均推理长度提升至10000Token以上,搭载该算法的32B参数大模型实测推理性能反超OpenAI o1-mini,为大模型复杂推理场景的低成本落地提供了新路径。

3 小时前
2026年4月8日,阿里通义实验室智能计算团队正式发布大模型后训练领域新型算法FIPO,依托独创的Future-KL机制破解纯强化学习普遍存在的长文本推理“长度停滞”瓶颈,32B规模模型在纯强化学习设定下性能超越DeepSeek-Zero-MATH及OpenAI o1-mini,标志国产大模型在逻辑推理与数学计算领域取得实质性进展。
AI问答助手,随时为您提供帮助
您好!我是AI小创,问答助手
我可以帮您:解读全站内容、回答专业问题、提供创作技巧等。随时为您提供帮助!
为了获得更好的交流体验: