当前全球AI产业掀起算力基建扩张潮,科技巨头纷纷投入万亿级资源布局大型数据中心,但算力浪费问题始终未得到有效解决。国内RISC-V架构AI芯片头部企业奕行智能研究团队测算发现,各类AI加速器实际利用率远低于理论峰值,其提出的可自主决策AI芯片技术论文,已入选计算机体系结构领域顶级学术会议,为破解算力浪费提供了新技术路径。
近年来,从海外科技巨头到国内头部AI企业,都在加速加码AI算力投入,吉瓦(GW)级超大规模AI数据中心已经成为行业标配,单座数据中心的投资规模动辄高达数百亿元。不少企业把堆算力、提峰值当成了AI竞争力的核心,但奕行智能研究团队的测算指出,当前绝大多数AI加速器的实际算力利用率,远低于芯片标注的理论峰值,大量算力在任务调度的空隙被闲置浪费,这也是当前AI训练与推理成本长期居高不下的核心原因之一。
传统AI芯片的算力调度逻辑,大多遵循“上层软件分配指令、下层硬件执行计算”的路径,指令传输和调度的延迟,会不可避免地产生算力空闲窗口。
本次奕行智能团队提出的新型架构,核心突破在于将算力调度决策权限直接下放到芯片硬件层面,芯片可以根据当前任务的负载变化,动态自主分配算力资源,不需要等待上游主控单元的调度指令,从底层架构层面压缩了算力闲置空间,从根源上提升了AI芯片的实际可用算力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 天前
美国AI安全与研发公司Anthropic近日宣布,联合全球另类资产管理巨头黑石、头部私募机构Hellman & Friedman、国际投行高盛共同成立全新企业级AI服务公司。新公司将聚焦各行业中型企业需求,将Anthropic旗下大语言模型Claude落地到企业核心业务场景,首批Anthropic应用AI工程师已确认入驻新公司核心团队。

7 天前
据AI产业研究院最新监测数据,当前国内82%的企业级AI项目交付效果不达预期,其中仅17%源于大模型本身质量缺陷,超7成问题出自效果评估体系缺失。业内近期首次提出「评估卫生(Eval Hygiene)」概念,呼吁建立全流程AI效果度量标准,解决过往人工抽查评估导致的效果偏差、合规风险等共性痛点。

7 天前
近日微软宣布将逐步取消Edge浏览器的侧边栏第三方应用功能,这是继Windows 11系统启动冗余功能精简计划后的又一生态调整。此次调整后,Edge侧边栏将集中承载微软Copilot等原生AI工具,预计将为全球超3亿Edge活跃用户带来更轻量化的浏览体验,也释放出微软进一步将AI服务整合到系统级入口的战略信号。

8 天前
2025年第一季度,全球头部科技企业AI布局节奏明显加快,OpenAI、谷歌、苹果、DeepSeek等厂商先后放出GPT-5、Gemini 2.5、Apple Intelligence 2.0、DeepSeek V3等新一代大模型产品,多端适配能力平均提升40%。同期全球消费级AI活跃用户规模突破18亿,环比增长27%,AI工具向日常生产生活渗透的速度远超行业预期。

8 天前
2025年第一季度全球AI消费级应用市场规模同比增长127%,OpenAI GPT-5、Google Gemini、苹果Apple Intelligence、DeepSeek等主流大模型厂商均在上半年公布核心产品迭代计划,马斯克旗下xAI的Grok、AI搜索工具Perplexity的月活用户环比涨幅均超过80%,生成式AI正式从技术尝鲜阶段进入规模化落地周期。

9 天前
近日,有海外用户实测谷歌旗下大语言模型Gemini接管个人Gmail邮箱的全流程操作,实测数据显示,Gemini可自动完成邮件分类、回复草稿生成、优先级标注,处理100封日常邮件耗时较人工减少72%,垃圾邮件识别准确率达98.7%,其落地体验远超多数用户对生成式AI办公工具的预期,为大模型C端办公场景落地提供了新参考。

9 天前
近期发布的全球AI使用行为调研显示,ChatGPT、Google Gemini、Apple Intelligence等主流AI产品的使用权限正呈现明显的阶层倾斜特征,高收入群体的AI付费服务渗透率、高频使用率均为年收入3万美元以下群体的3倍以上,AI资源分配不均或将加剧数字鸿沟,衍生多领域的新型社会不平等。

9 天前
2026年5月腾讯正式开源紧凑型AI翻译模型Hy-MT1.5-1.8B-1.25bit,依托1.25比特量化技术实现体积从3.3GB到440MB的大幅压缩,支持33种语言、5种方言共1056个翻译方向,可在智能手机完全离线运行,累计斩获30项国际机器翻译大赛冠军,翻译质量比肩谷歌翻译等商用方案及百GB级大模型。