近日谷歌正式推出新一代轻量大语言模型Gemini 3.5 Flash,官方测试数据显示该模型推理速度较前代提升68%,代码生成准确率高出42%,专门针对编码开发、AI智能体调度类任务优化。不少行业分析师指出,这款产品撬动企业市场的核心价值,将取决于其在复杂生产级工作流中的长期运行可靠性表现。
随着越来越多企业尝试把AI智能体接入日常业务流程,“跑不快、用不起、容易断”已经成为规模化落地的普遍痛点,过去半年全球企业级AI智能体的部署量同比上涨217%,但能真正覆盖全流程自动化的占比还不足12%。
很多企业过去部署智能体的时候,长期陷入两难选择:如果选用参数量在70B以上的通用大模型,单token推理成本是轻量模型的5到8倍,无法支撑日均百万级别的高频调用;如果改用小参数量的端侧模型,又很难完成多步工具调用、长逻辑链条推导的复杂任务,很容易出现执行错误拖垮业务效率。大量开发团队不得不在成本和性能之间反复折中,拖慢了AI落地的整体进度。
谷歌这次推出的Gemini 3.5 Flash,正是瞄准这一细分需求做出的定向迭代。官方公开的基准测试结果显示,该模型的推理延迟较同档位前代产品降低60%,HumanEval代码测试集准确率达到82%,同时原生支持最高128K的无截断长上下文窗口,覆盖企业常见的几十页业务文档、全量代码库的读取需求。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
20 秒前
本次资讯聚焦Google最新推出的全模态通用生成工具Gemini Omni,该产品整合新一代Gemini大模型的多模态能力覆盖图文、音视频全品类内容生产环节,可替代绝大多数中小型创作工作室的标准化工作流程,目前已有超2000家内容制作团队提交内测申请,将直接改写当前AI创作赛道的竞争格局。

2 分钟前
近日谷歌正式官宣将在其全球搜索引擎的图片检索模块上线全新AI生成内容溯源标注功能,依托Google自研的Content Credentials元数据技术,用户点击对应标注即可查看图片的生成工具、生成时间等完整信息,应对当前全网AI生成图片占比已突破40%带来的内容真伪辨别难题,为全网内容透明化树立行业参照。

4 分钟前
谷歌在2026年I/O开发者大会上正式发布全新音频驱动智能眼镜产品,该产品跳出此前AR眼镜依赖视觉显示的传统路径,深度整合Gemini大模型生态与谷歌全栈服务能力,主打全语音交互完成各类操作。业内认为该产品对标Meta近年推进的轻量化穿戴路线,有望在高速增长的AI穿戴市场打出差异化优势。

6 分钟前
近日谷歌正式宣布对旗下核心AI服务Gemini的全订阅体系完成重大调整,新增定价100美元/年的中高端专属档位,所有现有订阅方案同步下调定价,同时为不同层级用户开放此前仅面向内部测试的数十项新特性,覆盖网页、移动端及谷歌全硬件生态,进一步对标ChatGPT、Copilot Pro等头部AI订阅产品。

8 分钟前
近日谷歌旗下AI开发平台Google AI Studio完成重大功能迭代,依托Gemini大模型的原生适配能力,零编程基础用户无需编写任何代码,仅通过自然语言描述就能生成可直接部署运行的原生Android应用。该功能上线首周公开测试阶段,参与体验的用户数已经突破12万,大幅拉低了移动应用开发的准入门槛。

10 分钟前
近日美国陪审团快速驳回埃隆·马斯克针对OpenAI联合创始人及合作伙伴微软提起的诉讼,此前马斯克指控山姆·奥特曼窃取原本定位非盈利属性的OpenAI将其转为商业化实体。庭审披露的大量内部文件显示,马斯克早年执掌机构期间,本身就提出过将OpenAI商业化变现、引入科技巨头资源的相似规划,这起耗时近3年的行业标志性诉讼最终以马斯克败诉告终。

12 分钟前
蚂蚁集团旗下开源AI驱动数据可视化工具AntV近日曝出遭持续性npm供应链攻击事件,本次事件累计出现28个被篡改的恶意依赖包,波及国内超12万前端开发者的线上项目,资深网络安全研究员张磊表示,这是今年同类攻击中影响范围最大的事件之一,面向全行业AI开发者敲响依赖安全的警钟。

16 分钟前
谷歌依托Gemini大模型技术底座正式推出Workspace 24/7全时AI代理,据内部测试数据显示,该产品无需人工触发即可自主完成邮件回复、会议预约、文档协同整理等全场景办公操作,可将普通白领的日常行政类事务耗时降低42%,是当前消费级办公AI领域首个实现无人值守全时段运行的落地商用产品。