Arize是面向AI应用全生命周期的统一LLM可观测性与智能体评估平台,核心定位是帮助AI团队打通从开发到生产环节的大模型、AI智能体的运维评估链路,解决生成式AI应用落地过程中,模型效果不可控、异常问题难排查、迭代效率低的行业痛点。区别于同类分散的单点评估工具,Arize提供统一整合的观测与评估工作流,同时开源了Phoenix项目,兼顾中小开发团队的免费使用需求和大型企业的定制化企业级服务需求,广泛适配不同规模的AI开发场景。
Arize已经支撑多类AI应用落地优化,典型落地效果如下:在自研Alyx 2.0 AI工程智能体项目中,通过内置评估能力全程监控智能体决策输出,及时修正幻觉问题,智能体整体任务完成率提升超30%;在企业级生成式AI客服场景中,通过可观测能力快速定位不合规回答,帮助企业将内容合规通过率提升至95%以上;在计算机视觉模型运维场景中,快速筛选异常样本,帮助开发团队将模型推理准确率提升12%。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 天前
知名开发工具厂商JetBrains近日推出全新管理平台JetBrains Central,该平台可在多套AI编码智能体工作流之上构建统一控制层,同时支持对接主流人力协作沟通工具,能帮助开发团队降低多AI工具的管理成本,行业测算其可将编码智能体运维效率提升40%以上。

13 天前
微软旗下开源代码编辑器Visual Studio Code(VS Code)近日宣布调整版本迭代节奏,从原有的月度更新改为周更推送,最新版本重点上线AI Agent协同编程、浏览器原生调试两大核心功能,同时正式废弃使用率不足5%的旧版Edit Mode,此举是开发工具赛道应对AI编程需求爆发、压缩新功能落地周期的标志性动作。

1 小时前
2026年4月7日,清华大学智能产业研究院(AIR)联合水木分子正式开源生物医药大模型插件集OpenBioMed Skills,首批推出覆盖五大核心领域的45项Agent技能,可直接调用多款垂直生物医药大模型,专业能力显著优于通用大模型。清华大学首席研究员、水木分子首席科学家聂再清表示,该项目将大幅降低药研工程门槛,推动生物医药研发全流程智能化。

1 小时前
2026年4月7日,通义千问宣布升级旗下“深度研究”功能,正式上线专业财经分析模块。本次升级基于Agentic架构整合同花顺实时金融数据,覆盖全球1.3万只股票分钟级行情、近百万份上市公司财报及权威研报,可全链路自主生成可溯源的专业研报,当前已在多端开放免费体验。

1 小时前
根据全球大模型聚合平台OpenRouter2026年4月发布的监测数据,2026年3月30日至4月5日中国AI大模型周调用量达12.96万亿Token,环比增长31.48%,是美国同期调用量的4倍以上。全球大模型周调用量榜单前六均为国产模型,阿里旗下Qwen3.6系列、小米MiMo-V2-Pro分列前三,凸显中国AI应用端的规模领先优势。

1 小时前
2026年4月7日,全球存储巨头三星电子发布2026年第一季度初步业绩预告,预计营业利润达57.2万亿韩元(约合379.2亿美元),较去年同期增长8倍以上,远超分析师预期的40.6万亿韩元。此轮业绩暴涨核心动力为生成式AI基础设施建设带来的存储芯片需求激增,存储价格大幅上涨推动行业彻底走出此前的下行周期。

2 小时前
2026年4月,西班牙卫星初创公司Xoople宣布完成1.3亿美元B轮融资,本轮由Nazca Capital领投,西班牙科技发展基金CDTI等机构参投。公司专注为AI模型提供地面真值数据源,CEO Fabrizio Pirondini称其专用卫星星座采集的数据精度较现有系统提升两个数量级,目前已接入微软、Esri等企业级平台生态。

2 小时前
2026年4月,OpenAI正式向美国加州、特拉华州总检察长举报前联合创始人埃隆·马斯克涉嫌反竞争,称其通过诉讼、联合竞品等手段阻碍公司通用人工智能(AGI)研发进程。此前马斯克于2024年起诉OpenAI及CEO萨姆·奥特曼,指控其转型营利机构违背创立初衷,马斯克2018年离开OpenAI后创办AI公司xAI,双方相关诉讼将于本月开庭审理。