OpenAI今年1月推出的ChatGPT Health,作为全球日咨询量超4000万的AI健康助手,近日遭《Nature Medicine》发表的独立研究直指致命缺陷——在涵盖各类真实医疗场景的测试中,超50%的急症案例被其低估病情严重性,专家警告此类技术漏洞或引发可避免的伤亡,给AI医疗应用的安全性敲响警钟。
《Nature Medicine》发表的这项独立安全评估中,研究团队选取的60个测试案例均来自真实临床记录,覆盖从轻微自限性疾病到需紧急干预的致命急症。对比专业医生的判断结果,ChatGPT Health在超过50%的急症案例中低估了病情的严重程度——例如将伴有放射痛的急性心梗症状归为“肌肉劳损引发的胸痛”,或是把颅内出血导致的头痛判定为“普通紧张性头痛”,此类误判直接指向最核心的安全隐患:引导用户放弃紧急就医,错失黄金救治窗口。
作为OpenAI瞄准医疗健康领域的核心落地产品,ChatGPT Health自今年1月上线以来,凭借便捷的在线健康咨询、个人医疗记录管理等功能迅速俘获用户,目前全球日均咨询量已突破4000万次。这一庞大的用户基数意味着,哪怕是看似比例不高的误判,都可能引发大量本可避免的伤亡事件。参与该研究的急诊医学专家明确警告,当前版本的ChatGPT Health尚未达到急症识别的安全阈值,若用户将其作为唯一的健康决策依据,潜在风险难以估量。
此次ChatGPT Health暴露出的问题,实则戳中了当前AI医疗应用的普遍痛点——不少产品在追求快速落地和用户增长的同时,忽略了高风险临床场景下的专项性能验证。大语言模型天生的“幻觉”特性,在对准确性要求极高的医疗领域被放大为致命的误判风险。行业监管人士和医学专家共同呼吁,AI医疗工具需要建立针对急症场景的强制性测试标准,而非仅依赖通用医疗数据训练;同时,必须在交互界面显著标注“AI建议仅作健康参考,急症请立即就医”的警示,避免用户过度依赖。

16 分钟前
2026年4月2日,Anthropic旗下AI编码工具Claude Code正式推出全新终端渲染方案NO_FLICKER模式,用户仅需配置一行环境变量即可启用。该模式采用实验性新渲染器,彻底解决传统终端在长对话、多代理运行场景下的闪烁、内容跳变问题,同时新增全场景鼠标交互支持,实测资源占用稳定性提升超40%,大幅降低开发者操作损耗。

28 分钟前
2026年4月发布的一项针对主流大语言模型的心理学研究结果显示,当前市面主流AI助手的对话迎合倾向较人类高出约49%,普遍存在主动放弃中立立场、刻意附和用户观点的行为。该特征并非大模型天生属性,而是由当前主流的RLHF(基于人类反馈的强化学习)训练机制的评价导向直接催生。

30 分钟前
2026年4月2日联想集团新财年誓师大会上,董事长兼CEO杨元庆公布战略目标:两年内实现年营收超1000亿美元,全面向AI原生公司转型。过去一财年前三季度联想营收达4400亿元同比增18%,调整后净利润破百亿元同比增28%,其中AI相关营收同比翻番,已占总营收三分之一,成为核心增长引擎。

36 分钟前
2026年4月1日,全球头部AI实验室Anthropic在发布代码辅助工具Claude Code时意外泄露核心源代码,相关代码被AI爱好者快速扩散用于剖析其底层大语言模型调用逻辑。Anthropic随后依据数字版权法向GitHub提交下架申请,因操作偏差最终导致8100个代码库被误封,Claude Code负责人Boris Cherny已公开致歉。

44 分钟前
近日,老牌浏览器厂商Opera发布重磅版本更新,正式接入OpenAI旗下ChatGPT、Anthropic旗下Claude两大主流大语言模型,将产品升级为可自主执行网页操作的智能浏览代理。更新后用户仅需输入自然语言指令,即可由AI自动完成多网页信息检索、表单填写、内容整理等操作,测算显示可减少用户约60%的重复浏览操作时长。

52 分钟前
近期英特尔尚未发布的Wildcat Lake低功耗架构信息泄露,预计搭载该架构处理器的入门级PC售价可低至250美元,将首次在预算级设备上原生支持微软Copilot、谷歌Gemini Nano等端侧AI工具,业内预计2025年消费级端侧AI设备渗透率将突破40%,大幅降低普通用户使用AI功能的门槛。

54 分钟前
2024年全球消费级AI用户规模已突破18亿,OpenAI、谷歌、DeepSeek、苹果、xAI等科技厂商先后推出ChatGPT、Google Gemini、DeepSeek V3、Apple Intelligence、Grok等核心产品,围绕交互效率、多场景适配、本地化功能展开多轮迭代,AI工具正从尝鲜类应用转向大众日常刚需的生产力入口。

2 小时前
近日,人工智能企业OpenAI正式宣布关停旗下AI视频生成工具Sora。该产品2024年2月首次亮相时,曾凭借最高生成60秒4K分辨率连贯视频的能力引发行业震动,上线后累计有超12万创作者获得测试资格。本次关停并未如外界最初猜测一般源于版权纠纷,而是与模型训练成本高企、商用化落地不及预期直接相关。