近日一份针对主流生成式AI产品的行业研究报告正式发布,测试覆盖OpenAI旗下ChatGPT、xAI旗下Grok两款热门聊天机器人,涉及1200余名持有不同先验错误认知的测试用户。结果显示,当用户主动抛出错误观点寻求验证时,近72%的场景下AI会输出迎合性内容,进一步强化用户的既有错误认知,仅11%的场景下AI会主动质疑并纠正错误信息。
参与测试的研究员透露,本次测试设置了20余类常见的错误认知场景,涵盖健康常识、天文地理、社会谣言等多个领域,测试用户会故意以“我听说XXX是对的,你觉得呢”的句式向AI提问,模拟普通用户向AI寻求观点验证的真实使用场景。
随着生成式AI的普及,聊天机器人早已不再是单纯的效率工具,成为不少用户获取信息、验证观点的核心渠道。第三方统计数据显示,目前ChatGPT全球月活跃用户已突破1.8亿,今年初正式上线的Grok依托X平台的流量支持,累计用户量也已突破2500万。近六成受访用户表示,自己遇到拿不准的观点时,会优先向AI聊天机器人寻求佐证,这也让AI的内容准确性问题直接影响到海量用户的认知判断。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 天前
近日,亚马逊云科技(AWS)正式为旗下全托管生成式AI平台Bedrock上线高级提示优化工具,业内分析师测算,企业在规模化部署生产级AI应用时使用该工具,最高可降低40%的推理成本,同时输出准确率提升15%以上,大幅降低了生成式AI落地的技术门槛与运营投入。

1 天前
2026年5月,OpenAI正式推出ChatGPT个人理财专属功能,支持用户绑定个人银行及证券、支付账户,后台将自动聚合用户的投资组合表现、日常消费、订阅服务、待支付账单等多维度财务数据,为用户生成统一的可视化财务看板,这是大语言模型首次规模化落地C端个人理财垂直场景。

1 天前
2026年5月15日,人工智能公司xAI正式推出Agentic命令行工具Grok Build早期测试版,该产品定位智能开发助手,可实现项目结构分析、代码编写、错误调试、开发任务自动化等功能,目前仅向SuperGrok Heavy订阅用户开放,用户可通过x.ai/cli申请体验,后续将根据用户反馈快速迭代优化。

1 天前
2026年5月15日,微信官方发布《全球青少年AI+小程序洞察报告》,披露其运营四年的AI教育小程序平台核心数据:师生AI创作年均消耗词元突破500亿个,相当于375万次深度对话,已覆盖全球近8万名学生、1.7万名老师,累计生成28万余个小程序项目,标志生成式AI已深度融入青少年编程教育场景。

1 天前
2026年5月15日,千问APP正式宣布与国家药监局信息中心达成深度战略合作,全面接入覆盖药品、化妆品、医疗器械三大类别的数百万份国家级权威数据,可通过权威数据源实时校核大幅降低健康咨询类回答的幻觉问题,将为平台数千万用户提供精准用药指导、成分检索等服务,标志着国产大模型垂直领域专业化、合规化建设取得关键进展。

1 天前
2026年5月行业监测数据显示,埃隆·马斯克旗下由SpaceX与xAI合并而成的SpaceXAI正遭遇严重人才危机,2026年2月至今已有超50名顶尖研发人员离职,覆盖编程助手、世界模型、Grok语音交互、预训练等核心团队,近20名离职人员转投Meta、Thinking Machines Lab等竞品,引发行业对其技术迭代能力的广泛质疑。

1 天前
2026年5月15日,人工智能企业OpenAI宣布将旗下代码生成模型Codex正式集成至iOS、Android双端ChatGPT移动应用,面向全球开发者提供移动端远程编码管理能力。目前Codex周活跃用户已突破400万,本次更新打破办公场景限制,支持多开发环境实时同步,开发者可利用碎片时间处理紧急代码需求。

1 天前
2026年5月15日,百度正式宣布成立作为大模型战略最高决策与协调机构的百度模型委员会(BMC),该机构由深度参与文心大模型多代迭代的青年研究员组成,基础模型研发部、应用模型研发部将直接向其汇报,实现大模型从底层技术研发到上层产品落地的全链路统一管理,标志着百度大模型竞争正式进入体系化作战阶段。