2026年3月18日,高性能微调方案提供商Unsloth AI正式推出开源无代码工具Unsloth Studio,这是行业首个本地可视化大语言模型微调平台。该产品基于Triton语言定制反向传播内核,实现训练速度提升100%、显存占用降低70%,单块RTX4090消费级显卡即可完成8B、70B参数大模型微调,大幅降低LLM开发门槛。
对绝大多数中小开发者和垂直行业团队而言,大语言模型微调此前一直是门槛颇高的工作:不仅需要熟悉CUDA环境配置、掌握微调代码框架,动辙数万元的多卡GPU集群成本更是拦住了不少尝试者。3月18日Unsloth AI推出的新产品,直接把这道门槛砍到了消费级硬件可覆盖的范围。
近两年大模型落地进程加速,垂直场景的定制化需求持续上涨:电商平台需要微调专属商品描述生成模型、教育机构需要适配自身题库的答疑模型、企业需要基于内部知识库的办公助手模型,这类场景都需要在通用大模型基础上做微调优化。
但此前的微调工具对非算法专业开发者极不友好:仅CUDA环境配置就可能花费数天时间,微调70B参数模型更是需要至少4张A100显卡组成的集群,算力租赁成本单次就达数千元。作为此前行业应用最广的高性能微调开源库之一,Unsloth的产品此前已经积累了数十万开发者用户,本次推出的Studio版本,正是瞄准了非算法专业开发者的普惠需求。
Unsloth Studio并没有采用行业常见的低比特量化方案降低显存占用——这类方案通常会损失至少3%-5%的模型精度,而是通过Triton语言重构了反向传播内核,在完全不损失模型精度的前提下,实现训练速度翻倍、显存占用降低70%。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
2026年5月19日,蚂蚁集团自研的智能终端可信连接技术框架GPASS迎来新落地场景:搭载该技术框架的乐奇AI眼镜新版本正式上线城市伴游功能。作为杭州文旅、支付宝与乐奇联合打造的“镜游杭州”项目核心载体,首个文旅官方智能体“杭小忆”同步入驻,可实时为用户提供周边景点讲解、交互问答、导航等全链条服务。

1 天前
北京时间2026年5月19日,大模型独角兽Anthropic正式宣布对旗下两款核心AI产品Claude Design、Claude Code完成重磅功能升级。本次调整覆盖Pro、Max、Team、Enterprise全量订阅套餐,将所有付费用户的Token使用上限直接翻倍,同时将Claude Code快速模式的底层模型默认切换为最新Opus 4.7,不加价的前提下大幅降低创作者与开发者的使用门槛。

1 天前
2026年5月,亚马逊正式为其大模型重构的新一代语音助手Alexa+推出名为Alexa Podcasts的AI定制播客功能,该功能首批面向美国地区用户开放公测,用户仅通过一句简单语音指令,无需上传素材、编写脚本,即可在数分钟内获得完全匹配个人兴趣的专属播客内容,大幅拓展了消费级AI语音助手的落地边界。

1 天前
2026年5月,谷歌分拆企业SandboxAQ宣布与大模型厂商Anthropic达成深度合作,将自研科学AI模型集成至Claude平台,无需专业计算背景即可调用药物研发工具。背靠前谷歌CEO埃里克·施密特担任主席的团队,SandboxAQ已累计融资超9.5亿美元,此次合作直指传统药物研发平均耗时十年、耗资数十亿美元的行业痛点。

1 天前
国内头部大模型创业公司月之暗面(旗下拥有Kimi大语言模型)近期完成股东名单重大更新,国智投、北京人工智能基金等国资机构及中国移动正式入局,总额20亿美元的新一轮融资已步入收尾阶段,不到半年其累计融资额突破39亿美元,最新估值较去年11月的43亿美元实现4倍增长,成为国内资本关注度最高的AI创业项目之一。

1 天前
近日谷歌旗下整合了新一代Gemini大模型的秘密终端项目GoogleBook引发全行业热议,据上游供应链披露的不完全参数显示,该设备可实现70%的AI运算本地离线完成,近期第三方调研机构针对120名AI行业分析师的问卷显示,仅38%受访者看好其成为现象级产品,本文将拆解该项目的市场机会与现存争议。

1 天前
据行业测算,2024年全球终端侧AI芯片出货量同比增幅将超过72%,苹果为快速扩大自研生成式AI功能Apple Intelligence的落地覆盖范围,在新款消费电子设备中采用了定制化算力调配方案,OpenAI、谷歌、DeepSeek等头部厂商也同步推进GPT-5、Google Gemini等大模型的端侧适配研发,AI终端赛道竞争正进入全新落地阶段。

1 天前
2026年5月19日腾讯云正式官宣,旗下智能体开发平台ADP搭载的两款核心大模型Hy3preview、DeepSeek-V4-Pro,将于2026年5月27日10点结束全用户免费公测,全面转入正式商业化运营,后续采用实际调用量按量计费规则,配套四档梯度订阅套餐覆盖不同规模用户需求,为国内智能体落地的成本体系划定了新的参考标尺。