近期一项针对全球主流生成式AI工具的公众医疗咨询测试显示,OpenAI开发的ChatGPT、谷歌开发的Gemini等多款头部AI聊天机器人,在响应普通人常见健康咨询需求时,超半数情况下会输出错误甚至存在误导性的医疗建议。该结果再次引发AI领域对大模型医疗应用落地风险的讨论,也为普通用户使用AI获取健康指导敲响了安全警钟。
测试团队整理了百余个普通人常在线上咨询的健康问题,从常见慢性病的用药调整到急性不适的应急处理,覆盖了大众健康咨询的主流场景。测试结果显示,仅不到一半的AI回复符合专业临床规范,超过三成错误回复存在明确的安全风险,比如错写处方药剂量、遗漏药物过敏禁忌,甚至推荐已被临床淘汰的治疗方案,可能对使用者健康造成直接危害。
近年来,随着大语言模型能力快速提升,AI健康咨询已经成为普通用户获取健康信息的热门渠道,不少用户遇到轻微不适首先会选择问AI,而非线下就医。但目前绝大多数面向C端的通用AI聊天机器人,训练数据多来自公开网络内容,没有经过专业医疗机构的审核校验,也未获得医疗服务相关资质,本质上属于非正规健康信息来源。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
17 分钟前
美国AI网络基础设施初创公司Upscale AI由两位60后行业资深人士联合创立,成立仅7个月已完成累计超20亿元人民币融资,现正推进新一轮10亿级人民币融资,由老虎环球基金领投,投后估值有望达约20亿美元。截至目前该公司尚未推出正式商用产品,其融资进度与估值水平引发AI创投圈广泛关注。

2 小时前
4月17日OpenAI正式推出Codex大版本更新,本次升级新增Mac端光标级后台交互、内置应用内浏览器、集成gpt-image-1.5图像生成模型,同步上线90余款生态插件。升级后Codex支持断点续跑、自主排期执行长期任务,可直接操作Mac本地应用,大幅降低了用户搭建跨应用自动化工作流的门槛。

3 小时前
美国AI公司Anthropic于2026年4月16日正式推出新一代大语言模型Claude Opus 4.7,Claude Code之父、核心研发人员Boris Cherny于次日公开其内部测试后总结的高效使用技巧。据其披露,Opus 4.7相比前代4.6版本在智能性、主动性、精准度上均有明显提升,普通用户需调整原有使用习惯才能充分释放模型的全部性能。

4 小时前
2026年4月17日,联想开天正式发布新一代政企办公智能体天禧AI Pro,定位“可信AI搭档”,同步宣布旗下全线PC产品升级为信创AI PC。该产品与麒麟操作系统深度整合推出双生界面,兼容DeepSeek、千问、火山等多参数级大模型,将操作逻辑从“以工具为核心”转向“以任务为中心”,标志着国内信创办公赛道正式迈入AI落地阶段。

5 小时前
OpenAI最新披露的运营数据显示,旗下对话式大语言模型产品ChatGPT全球周活跃用户即将突破10亿大关,用户结构出现标志性变化:女性用户占比从2022年上线初期的20%提升至50%以上,首次超过男性用户,对应约5亿女性用户定期使用。同时OpenAI算力规模持续扩张,2025年预计达1.9吉瓦,2030年目标锁定30吉瓦。

5 小时前
2026年4月15日,科大讯飞举办AstronClaw升级发布会,集中推出9项创新产品,首次完整公开软硬一体AI Agent架构体系,推动AI智能体从传统“对话助手”向“物理执行中枢”演进,打破屏幕限制让大模型能力深度介入真实物理世界与复杂业务流,同时发布配套40克轻量化AI眼镜GlassClaw,覆盖办公、移动交互等多场景落地。

5 小时前
OpenAI最新披露数据显示,旗下生成式AI工具ChatGPT用户性别结构出现历史性逆转:2022年发布之初女性用户占比仅20%,当前已反超男性突破50%,对应约5亿女性定期使用,总用户规模逼近10亿。同时其可用算力从2023年的0.2吉瓦升至2025年的1.9吉瓦,已联合英伟达等厂商锁定2030年30吉瓦算力目标。

5 小时前
2026年4月15日,Snapchat母公司Snap宣布裁员1000人,占全职员工总数16%,同步取消300余个空缺职位,预计每年节省成本5亿美元。本次裁员此前已获激进投资者艾瑞尼克资本施压推动,核心驱动为AI工具已替代65%的编程工作,消息公布后Snap股价当日上涨5.8%。