登录体验完整功能(收藏、点赞、评论等) — 已累计有 11116 人加入

Perplexity AI推出混合推理编排器 实现端云AI任务自动调度

详情页推荐

近日,AI搜索与推理服务商Perplexity AI正式推出混合本地-服务器推理编排器,该工具可无需用户手动配置,自动将AI任务在个人电脑本地硬件与云端前沿大模型之间拆分调度,在兼顾隐私安全的同时大幅降低推理成本、提升响应速度,为消费级设备运行复杂AI应用提供了新的落地路径。

配图

不少PC用户在运行AI应用时都遇到过类似的两难:本地跑不动70B参数以上的大模型,传数据到云端又担心隐私泄露,手动切换运行模式的操作更是复杂到劝退普通用户,这一现状现在有了新的解决方案。

当前消费级设备的AI运行模式主要分为纯端侧和纯云端两种,前者高度依赖本地硬件算力,普通消费级显卡通常只能流畅运行10B参数以内的小模型,处理复杂多模态任务、工具调用需求时容易出现卡顿甚至崩溃;后者则需要将所有用户数据上传到云端服务器,除了隐私泄露风险,还容易受到网络波动影响出现响应延迟,长期使用的API调用成本也居高不下。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。