全球半导体厂商AMD正式发布面向端侧AI场景的全新Ryzen AI Max 400系列处理器,最高可支持192GB统一内存容量,彻底打破过往移动端AI算力平台的内存瓶颈。该产品可直接本地运行70B甚至更大参数的开源大模型,首批适配的移动工作站产品预计2025年第二季度逐步放量,有望重构端侧AI硬件的现有竞争格局。
过去两年端侧AI的普及始终卡在内存短板上:主流消费级移动端处理器最多仅能配置64GB内存,运行13B参数以上的大语言模型就需要大量调用虚拟内存交换,推理延迟直接飙升到数秒,完全无法实现流畅的本地交互体验。
随着DeepSeek、Llama 3等开源大模型快速迭代,越来越多的用户倾向于选择本地部署AI服务,避免云侧交互的隐私泄露风险与网络波动限制。
此前苹果、英特尔推出的端侧AI硬件,最高内存配置普遍卡在96GB水平,仅能满足单进程运行4bit量化70B大模型的需求,一旦同时开启Apple Intelligence、微软Copilot等多个常驻AI助手,很容易出现内存溢出、进程崩溃的问题,专业AI开发者长期没有适配重度需求的移动硬件方案。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年5月21日,AI编程工具厂商Cursor正式推出完全自研的新一代编程专属大模型Composer 2.5,彻底摆脱此前对Claude系列的技术依赖。该模型实测编程性能追平当前行业头部产品Claude Code,定价仅为后者的十分之一,有望扭转此前Cursor被竞品抢占市场份额的不利局面。

1 小时前
腾讯混元于2026年5月正式开源全新多语言翻译模型家族Hy-MT2,依托自研AngelSlim 1.25-bit极端量化技术实现轻量化突破,全系列支持33种通用语言与5种中国民族语言/方言互译,轻量版本体积仅440MB可在移动端本地部署,同步上线的“腾讯Hy翻译”小程序覆盖普通用户日常翻译需求,为开发者提供了高适配的开源翻译底座。

1 小时前
国内头部大模型厂商月之暗面(Moonshot AI)在完成20亿美元新一轮融资后,正式启动VIE及红筹架构拆除工作,整体重组完成后公司将满足赴港上市的全部合规要求,冲击200亿美元的资本市场估值,这也将成为国内生成式AI赛道成立时间最短、估值跃升速度最快的准IPO企业之一。

1 小时前
近期OpenAI旗下GPT-4o、DeepSeek等大模型产品的商业化落地进程加速,国内阿里云、腾讯云等主流云服务商的统计数据显示,已有68%的千人级规模企业启动内部规模化AI部署项目,大量原本为传统应用部署搭建的云环境,正在被迫承接具备可治理、可复现要求的全链路AI执行系统,工程团队正面临前所未有的架构适配压力。

1 小时前
近日微软正式面向全球开发者开源两款面向AI智能体场景的安全工程工具,由微软AI安全工程团队主导研发,针对当前行业内近七成智能体开发项目缺少标准化安全运维链路的痛点,这套工具可实现从开发测试到上线运行全周期的持续风险校验,将智能体非预期行为的触发概率降低超65%,填补了智能体落地阶段的安全工具空白。

1 小时前
谷歌Angular开发团队近期正式发布全新特性Signal Forms,针对当前72%的AI原生应用开发者反馈的表单状态不同步痛点,采用状态优先模型重构表单校验、UI更新全链路逻辑,相比传统事件流水线开发模式实现性能提升63%,大幅降低RAG等生成式AI应用的前端交互响应延迟。

1 小时前
资深记者Casey Crownhart近期发布的产业调研显示,2026年美国新政府第二任期上台满一年后,传统脱碳赛道的公共政策支持力度明显下滑,超过62%的头部气候科技企业,正在将AI大模型落地的核心场景从通用脱碳方案转向关键矿产全链路优化,相关赛道一季度融资额同比上涨127%。

1 小时前
字节跳动旗下全球主流剪辑工具CapCut正式宣布与谷歌大模型产品Google Gemini打通,将近20项核心AI剪辑功能原生接入Gemini生态,创作者无需跳转多平台即可完成从文案生成到成片输出的全流程操作,经内部实测可将普通用户的短视频生产耗时降低62%,成为消费级大模型与创意工具融合的标志性进展。