登录体验完整功能(收藏、点赞、评论等) — 已累计有 9369 人加入

让AI触手可及,让应用激发潜能

谷歌发布Gemini 3.5 Flash 推动AI代理深度融入企业工作流

近日谷歌正式推出新一代轻量大语言模型Gemini 3.5 Flash,官方测试数据显示该模型推理速度较前代提升68%,代码生成准确率高出42%,专门针对编码开发、AI智能体调度类任务优化。不少行业分析师指出,这款产品撬动企业市场的核心价值,将取决于其在复杂生产级工作流中的长期运行可靠性表现。

随着越来越多企业尝试把AI智能体接入日常业务流程,“跑不快、用不起、容易断”已经成为规模化落地的普遍痛点,过去半年全球企业级AI智能体的部署量同比上涨217%,但能真正覆盖全流程自动化的占比还不足12%。

很多企业过去部署智能体的时候,长期陷入两难选择:如果选用参数量在70B以上的通用大模型,单token推理成本是轻量模型的5到8倍,无法支撑日均百万级别的高频调用;如果改用小参数量的端侧模型,又很难完成多步工具调用、长逻辑链条推导的复杂任务,很容易出现执行错误拖垮业务效率。大量开发团队不得不在成本和性能之间反复折中,拖慢了AI落地的整体进度。

谷歌这次推出的Gemini 3.5 Flash,正是瞄准这一细分需求做出的定向迭代。官方公开的基准测试结果显示,该模型的推理延迟较同档位前代产品降低60%,HumanEval代码测试集准确率达到82%,同时原生支持最高128K的无截断长上下文窗口,覆盖企业常见的几十页业务文档、全量代码库的读取需求。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯