登录体验完整功能（收藏、点赞、评论等） — 已累计有 8999 人加入

发现精彩内容

🔥 AI免费生成PPT 🔥 免费AI配音专家警示人机关系

最近搜索清空记录

创作类工具 0

全品类工具 0

文章资讯 4

Empty

抱歉，没有找到相关的创作类工具

返回首页

Empty

抱歉，没有找到相关的全品类工具

1 小时前
NVIDIA推出NVFP4 4位预训练法 12B混合模型验证落地
5月18日，NVIDIA正式公布面向大语言模型预训练的全新4位精度技术方案NVFP4。该方案通过前沿架构模型完成可行性验证：基于120亿参数的混合Mamba-Transformer模型，在累计处理10万亿token数据的基准场景下，NVFP4将预训练阶段的显存占用大幅压缩，同时未显著损失模型性能，为大模型训练的成本控制提供突破性路径，填补了低位精度预训练在混合架构领域的实践空白。
11 0
2 个月前
Transformer作者推出IronClaw：重构安全版“龙虾”替代OpenClaw
Transformer核心作者Illia Polosukhin针对AI智能体凭证泄露等安全痛点，推出全新开源安全框架IronClaw，替代原有存在风险的OpenClaw。IronClaw采用Rust语言开发，通过加密存储凭证、WASM沙箱隔离工具执行、可信执行环境部署等技术，彻底解决AI智能体“裸奔”问题，目前已支持macOS、Linux、Windows多系统本地或云端部署。
50 0
2 个月前
Inception Labs发布全球首个扩散式推理大模型Mercury 2，弃用Transformer
人工智能初创公司Inception Labs近日推出全球首个基于扩散模型的推理大模型Mercury 2，弃用当前主流的Transformer架构。该模型可同时对多文本块进行全局优化与重写，在英伟达Blackwell GPU驱动下实测生成速度达每秒1009个Token，为大语言模型的架构创新开辟了新路径。
82 0
2 个月前
突破Transformer天花板？Inception发布全球首个扩散架构推理大模型Mercury 2
人工智能初创公司Inception Labs近日推出全球首个基于扩散模型架构的推理大模型Mercury 2，彻底弃用主流Transformer架构。该模型以全局优化替代逐Token生成方式，在英伟达Blackwell GPU驱动下，实测生成速度达每秒1009个Token，有望突破传统大模型性能瓶颈，开启文本生成范式新变革。
126 0

© 2026 AI创作导航. All Rights Reserved.

滇ICP备2026002425号-1 公安备案图标

公安备案图标

滇公网安备 53252802528133号