2026年4月29日,腾讯混元团队正式开源极限量化压缩翻译模型Hy-MT1.5-1.8B-1.25bit。该模型基于专业翻译大模型Hy-MT1.5研发,支持33种主流语言互译,经1.25bit极致量化压缩后体积仅440MB,可在移动端完全离线运行,较原1.8B版本内存占用降低近87%,为离线翻译场景提供了全新轻量化解决方案。
对于经常跨境出行、需要在无网络环境下处理涉外内容的用户来说,离线翻译的体验长期差强人意:精度高的翻译工具体积动辄数GB挤占存储空间,轻量工具又经常出现语义偏差,联网翻译则面临信号差、隐私泄露的双重风险。此次腾讯混元推出的开源模型,恰好击中了这一行业长期存在的痛点。
此前行业内的端侧翻译方案主要分为两类:一类是基于小参数模型的轻量化工具,词汇量少、专业内容翻译偏差大,只能满足日常简单交流需求;另一类是基于大模型的翻译方案,原始1.8B参数的大语言模型如果用常规16-bit精度存储,内存占用可达3.3GB,大部分中低端移动设备根本无法流畅运行,更不用提实时翻译的延迟问题。
如何在不损失翻译精度的前提下压缩模型体积,成为端侧翻译落地的核心瓶颈。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年4月30日,Google旗下Chrome浏览器正式发布Prompt API,开发者仅需通过简单JavaScript代码,即可在网页端直接调用内置的Gemini Nano轻量级大语言模型,无需接入云端即可实现本地AI能力。该功能上线后随即在Hacker News引发热议,被业内视为浏览器AI能力普及的里程碑事件。

14 小时前
近期供应链消息显示,苹果将在下一代iPhone系列中全面搭载自研端侧AI系统Apple Intelligence,新增AI算力硬件成本较上一代提升约20%,叠加大语言模型服务运维及OpenAI技术授权投入,新机起售价预计较iPhone 15系列上涨8%-12%。这是苹果首次将AI功能作为旗舰机型核心升级卖点,相关消息已引发消费市场广泛讨论。

18 小时前
2026年4月29日,腾讯混元团队赶在五一黄金周前发布专业翻译大模型极致量化版本Hy-MT1.5-1.8B-1.25bit,体积仅440MB,支持手机本地离线运行。该模型通过1.25bit量化技术将原3GB模型压缩至八分之一,覆盖33种语言、5种方言,可在无网络环境下为出境游用户提供高质量翻译服务。

1 天前
生成式AI的端侧落地浪潮,正在推动Web前端开发领域从过去的框架之争转向底层架构选择。行业研究者提出,当前AI驱动的Web应用正面临“响应式、超媒体、本地优先”前端架构三元悖论,三者核心目标冲突难以同时优化,据最新行业调研数据,目前全球超62%的生成式AI前端开发团队已启动架构选型重评估。

3 天前
近日,开发者借助Google研发的TurboQuant量化算法,成功将Gemma 4大模型部署到浏览器端实现本地运行。用户无需配置复杂API环境,也无需支付任何订阅费用,就能在本地获得流畅的AI交互体验。该算法针对大模型KV缓存优化,可将缓存向量压缩至原体积的六分之一,支持压缩状态直接检索,破解了本地运行大模型的内存痛点。

5 天前
2026年4月24日,AI搜索创业公司Perplexity首席执行官Aravind Srinivas在公开访谈中,抛出了AI时代智能手机价值的全新判断:AI技术进步不会颠覆现有智能手机市场,更不会取代iPhone的核心地位,反而会推动iPhone演变为AI系统不可或缺的“数字护照”。他同时指出,苹果自研的Apple Silicon芯片的端侧AI算力优势,长期被整个行业低估。

6 天前
2026年4月23日,联想在ThinkPad新品暨天禧AI生态发布会上推出分级AI主机阵列,包含ThinkCentre Mini、ThinkCentre、ThinkCentre Pro三款产品,分别覆盖个人、团队、企业级用户的差异化算力需求。该系列支持本地AI运行,可降低网络延迟、防范数据隐私泄露,为用户提供云端算力租用之外的本地AI部署新选择。

6 天前
2026年4月23日,腾讯混元正式发布并开源基础设施重建后的首个大模型产品Hy3 preview。该模型为融合快慢思考逻辑的混合专家模型,总参数达295B,激活参数21B,最大支持256K上下文长度,在复杂推理、指令遵循、智能体等多维度能力上实现显著提升,主打全场景实用性。