登录体验完整功能(收藏、点赞、评论等) — 已累计有 12502 人加入

19款大语言模型研究显示:安全护栏是护盾也是阻碍

详情页推荐

科技媒体InfoWorld近日发布针对19款主流大语言模型的专项调研,聚焦当前AI安全领域最核心的争议点——大语言模型安全护栏机制的实际价值。调研指出,当前AI行业对安全护栏的态度呈现明显分裂:合规端要求筑牢安全防线避免有害输出,而不少开发者与行业用户则提出,过度严格的护栏反而会限制模型在专业场景的正常能力发挥。

这次调研覆盖了从闭源到开源的19款当前市面主流大语言模型,涵盖消费级应用、专业研发、工业落地等多个使用场景,调研数据清晰呈现了行业的分歧。

在面向公众的消费级场景和金融、医疗等敏感领域,超过60%的受访企业合规团队将安全护栏列为AI落地的必备要求。在多起AI生成有害内容引发社会争议后,监管和企业都将统一的安全护栏视作降低合规风险的最直接手段。

而在科研、网络安全攻防、代码开发等专业领域,近40%受访开发者反馈,过度僵化的粗粒度安全护栏反而会成为工作阻碍:比如网络安全研究员研究恶意代码特征、开发者调试漏洞防御方案时,经常被护栏误判为恶意请求,直接拒绝输出,拖慢了正常研发进度。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。