
1 小时前
2026年6月,大模型厂商Moonshot AI(月之暗面)正式推出开源终端AI编码工具Kimi Code CLI。该工具采用TypeScript编写,以MIT开源协议对外开放,内置子代理调用能力,可直接在终端环境完成代码生成、调试、项目搭建等全流程操作,为下一代AI智能体的落地研发提供轻量化开发入口,上线首日即登上GitHub全球趋势榜Top3。

2 小时前
英伟达近期推出开源权重自动语音识别模型Nemotron 3.5 ASR,该模型采用缓存感知流式架构,参数量仅6亿,可实现40个语言地区的实时语音转写,支持用户根据场景需求灵活配置延迟阈值,在消费级硬件上即可实现低延迟推理,为实时字幕、会议转写、智能客服等多场景语音交互落地提供了轻量化高可用的新方案。

11 小时前
近日高通上线针对高通AI Hub模型的官方实操开发教程,覆盖图像分类、目标检测等主流计算机视觉任务,提供从加载模型、本地PyTorch推理、目标识别到真实硬件部署的全流程代码指引,可帮助开发者快速适配高通系端侧硬件,大幅降低边缘AI应用的开发落地门槛。

15 小时前
当地时间2026年6月5日,谷歌与SpaceX正式公布算力采购长期合作协议,前者将每月向后者支付9.2亿美元,采购其分布式算力资源支撑大语言模型训练、多模态模型推理等核心AI业务需求。该合作公布时间距SpaceX计划中的首次公开募股仅一周,也创下目前全球公开的单笔AI算力月度采购订单最高纪录。

15 小时前
近日Google DeepMind正式发布Gemma 4系列QAT(量化感知训练)检查点,包含Q4_0量化版本与全新移动端专属格式,可将端侧设备运行大模型的内存占用最高降低75%,无需损失过多推理精度即可让中端手机、边缘设备流畅运行百亿参数级大模型,为端侧AI应用落地再降技术门槛。

16 小时前
近日,微软旗下代码托管平台GitHub正式推出AI编程工具Copilot的两项全新功能——桌面端独立应用与开发者协作工作台,同时基于实际使用量的计费模式正式生效。行业分析师指出,新功能可有效降低开发者操作成本、提升协作效率,但消费模式转向用量付费后,企业用户需完善AI工具治理体系,建立清晰的投入产出核算标准。

17 小时前
近日,微软针对自主执行多场景任务的AI代理(AI Agent)产品更新了安全风险分类框架,新增7类此前未被纳入通用安全体系的新型攻击路径。该框架将帮助行业统一AI Agent安全漏洞的表述标准,推动相关安全修复方案的落地,目前AI Agent已在企业办公、生产调度等场景规模化落地,相关漏洞潜在影响覆盖超千万企业用户。

17 小时前
近期全球多地监测到针对Ruby开发工具链的伪安全补丁供应链攻击,其中32%的紧急推送补丁被植入恶意代码,大量为生成式AI应用提供后端支撑的Ruby开发团队选择暂时延迟非关键补丁更新,通过白名单校验、隔离测试等方式规避次生风险,这一做法也引发了AI开发领域对快速迭代与安全平衡的广泛讨论。

18 小时前
近日,微软人工智能部门负责人公开表态,AI初创公司Anthropic旗下商用服务定价过高,目前微软正在推进内部订阅调整,为大量工程师取消Claude Code的使用权限。这是头部科技企业首次公开吐槽大模型商用成本,也释放出生成式AI进入落地阶段后,企业侧成本管控需求正快速提升的明确信号。

19 小时前
2026年6月2日,AI大模型厂商Anthropic官方宣布扩展旗下安全协作项目Project Glasswing,本次将面向全球15个以上国家的约150家新机构开放权限,项目搭载其最新大模型产品Claude Mythos Preview,此前首批50家合作方已基于该工具扫描自身代码库,累计发现超1万个潜在安全漏洞,为关键软件系统防护提供了AI驱动的全新解决方案。

19 小时前
据2026年上半年AI行业调研数据,头部大模型厂商的单位token推理成本较2024年同比上涨217%,过去两年奉行tokenmaxxing扩张策略的行业逻辑彻底反转。微软、OpenAI、国内大模型厂商DeepSeek等均已将成本管控列为核心业务优先级,全行业正从跑马圈地的粗放增长转向精益运营的新阶段。

21 小时前
澳大利亚头部数据中心运营商AirTrunk近期宣布,将投入300亿美元在印度市场新建总容量达5GW的AI专用数据中心集群。这是印度AI基础设施领域迄今规模最大的外资投入之一,将直接缓解当地快速扩大的AI算力供给缺口,也为全球云计算、大模型厂商布局南亚市场提供核心硬件支撑。

23 小时前
2026年6月,英伟达正式推出面向云原生AI部署场景的技术方案Dynamo Snapshot,该方案基于CRIU检查点技术,搭配自研cuda-checkpoint工具,可在Kubernetes(K8s)平台上快速恢复单GPU推理工作节点,大幅压缩AI推理服务的冷启动延迟,为云侧AI推理的弹性资源调度效率升级提供了核心技术支撑。

23 小时前
近日,AI搜索与推理服务商Perplexity AI正式推出混合本地-服务器推理编排器,该工具可无需用户手动配置,自动将AI任务在个人电脑本地硬件与云端前沿大模型之间拆分调度,在兼顾隐私安全的同时大幅降低推理成本、提升响应速度,为消费级设备运行复杂AI应用提供了新的落地路径。

1 天前
2026年6月,OpenAI全球事务负责人乔治·奥斯本在伦敦SXSW活动上公开表态,将支持并签署美国总统特朗普此前发布的AI模型发布前审查行政令,自愿在前沿大模型正式发布前30天向美国联邦政府提交访问权限,参与相关基准测试与安全评估流程,是首个公开明确表态支持该行政令的头部AI研发机构。

1 天前
2026年6月,OpenAI首席执行官萨姆·奥特曼在公开企业活动中提出AI产品发展三阶段理论,将AI产品依次划分为聊天模型(代表为ChatGPT)、代理系统(代表为Codex)、主动式AI三个阶段,明确当前行业处于代理系统发展期,同时透露OpenAI正推进整合多能力的超级应用研发,现阶段全行业普遍面临AI预算不足的压力。

1 天前
2026年6月5日,腾讯混元团队联合中国人民大学高瓴人工智能学院正式开源大语言模型规划能力评测框架PlanningBench。该框架覆盖超30种规划任务类型,横跨六大类实际应用场景,兼具模型评测与训练支撑能力,可有效规避传统评测中的模型“刷题”问题,为大模型产业落地提供统一的能力评估标尺。

1 天前
2026年6月披露的行业案例显示,杭州一名内容创作者借助AI音乐创作工具实现商业化变现:上传图片即可在40秒内生成曲风多样、人声逼真的完整音乐作品,通过批量产出内容发布至音乐平台、短视频平台获取分成收入,月收入超过10万元。该案例印证AIGC在音乐赛道的落地价值,同时AI声音克隆相关的风险也引发关注。

1 天前
2026年6月,浙江杭州一名无专业乐理基础的从业者,借助生成式AI音乐工具实现月入十余万。该工具可支持用户输入创意、哼唱甚至单张图片,最快40秒即可完成作词、作曲、编曲、演唱全流程,产出覆盖多曲风的专业级音乐,普通听众无法区分其与真人演唱的差异,事件引发AI音乐行业对商业化落地的广泛讨论。

1 天前
6月2日,稀宇科技(MiniMax)就旗下新一代旗舰多模态模型MiniMax-M3上线后的计费规则调整争议发布致歉声明。此前平台未提前告知存量用户,将原有面向开发者的按次计费模式改为按Token消耗量计费,且同等任务下Token消耗远超预期,导致大量开发者月度额度快速耗尽引发集中投诉,官方同步公布了老用户补偿及退款方案。

1 天前
2026年6月3日,谷歌正式面向旗下入门级操作系统Android Go推出轻量化AI助手Gemini Go。该产品专为配备2GB及以上运行内存的低配安卓设备定制,可直接替代原有Google Assistant Go成为系统默认助理,用户无需额外下载应用即可体验生成式AI服务,此举被视为谷歌推动AI普惠的重要落地动作。

1 天前
2026年6月5日,电商娱乐巨头亚马逊宣布启动游戏业务战略重组,将Prime游戏、亚马逊游戏工作室、Luna云游戏三大独立板块整合为统一组织,确立平台+内容的双轨制发展路线,将联手007、史努比狗狗等知名IP,结合生成式AI发力休闲云游戏赛道,瞄准全球消费娱乐市场提升盈利空间。

1 天前
随着生成式AI与大语言模型应用的快速落地,服务于结构化数据处理的传统框架ETL正被全新技术体系替代。据企业级AI落地行业测算,当前已有超62%的企业级生成式AI应用将嵌入流水线作为核心数据处理环节,采用标准化嵌入流水线的AI应用,语义召回准确率平均提升42%,数据预处理耗时较传统方案降低58%,成为AI时代数据工程领域的核心变革方向。

1 天前
近日行业针对Agentic AI(智能体AI)的成本结构研究显示,其经济性核心影响因素并非底层大模型选型,而是系统允许的自主思考轮次、推理循环次数与工具调用权限。当前成熟落地的智能体AI项目中,工具调用与多轮推理的开销占比已达整体成本的65%以上,远高于基础模型调用的成本占比,为AI企业成本优化指明了新方向。