抱歉,没有找到相关的创作类工具
抱歉,没有找到相关的全品类工具
1 小时前
5月18日,NVIDIA正式公布面向大语言模型预训练的全新4位精度技术方案NVFP4。该方案通过前沿架构模型完成可行性验证:基于120亿参数的混合Mamba-Transformer模型,在累计处理10万亿token数据的基准场景下,NVFP4将预训练阶段的显存占用大幅压缩,同时未显著损失模型性能,为大模型训练的成本控制提供突破性路径,填补了低位精度预训练在混合架构领域的实践空白。
2 个月前
Transformer核心作者Illia Polosukhin针对AI智能体凭证泄露等安全痛点,推出全新开源安全框架IronClaw,替代原有存在风险的OpenClaw。IronClaw采用Rust语言开发,通过加密存储凭证、WASM沙箱隔离工具执行、可信执行环境部署等技术,彻底解决AI智能体“裸奔”问题,目前已支持macOS、Linux、Windows多系统本地或云端部署。
人工智能初创公司Inception Labs近日推出全球首个基于扩散模型的推理大模型Mercury 2,弃用当前主流的Transformer架构。该模型可同时对多文本块进行全局优化与重写,在英伟达Blackwell GPU驱动下实测生成速度达每秒1009个Token,为大语言模型的架构创新开辟了新路径。
人工智能初创公司Inception Labs近日推出全球首个基于扩散模型架构的推理大模型Mercury 2,彻底弃用主流Transformer架构。该模型以全局优化替代逐Token生成方式,在英伟达Blackwell GPU驱动下,实测生成速度达每秒1009个Token,有望突破传统大模型性能瓶颈,开启文本生成范式新变革。