OpenAI首席执行官Sam Altman在一场全球AI行业峰会上抛出两大重磅消息:OpenAI将首次推出面向开发者的开源大模型,同时GPT-5正加速迭代,将实现完全多模态能力,打通文本、图像、音频、视频等全类型数据的理解与生成闭环。这一转向不仅打破了OpenAI长期坚守的闭源策略,更将重构全球大模型市场的竞争与生态格局。
回顾OpenAI的发展轨迹,自GPT-3.5开启商业化以来,其核心旗舰模型始终采用闭源模式,凭借GPT-4系列的领先性能占据了全球生成式AI市场的头部位置,但也引发了行业关于技术壁垒过高、生态封闭的持续争议。此次主动拥抱开源,被视为OpenAI在全球开源大模型浪潮下的战略调整——当前全球已有超150款开源大模型落地,Meta的Llama系列、Mistral的轻量模型凭借灵活性与低成本,在开发者社区和中小企市场快速渗透。Statista数据显示,2024年开源大模型在企业端部署的占比已达42%,闭源模型的市场份额正被逐步分流。
关于即将推出的开源模型,Sam Altman并未披露具体参数规模,但明确其核心定位是“轻量化、高适配性”,将重点针对边缘设备、垂直行业场景优化,比如嵌入式AI终端、智能客服系统、工业检测等。与闭源模型的API调用模式不同,这款开源模型将允许开发者自由下载、修改和二次训练,甚至可以基于其底层代码定制专属模型。国内AI研究机构智研院首席分析师指出:“OpenAI开源的核心逻辑是‘以生态换增长’——通过释放技术底座,吸引全球数百万开发者参与模型优化,反过来为其闭源的GPT-5积累场景反馈和技术迭代灵感,形成‘开源托底、闭源攻坚’的双轮驱动。”
而GPT-5的完全多模态能力,无疑是此次官宣的最核心亮点。此前的GPT-4V仅支持文本与图像的有限交互,完全多模态则意味着模型将实现全类型信息的无缝融合:用户上传一段工业设备的运行视频+传感器数据流,GPT-5不仅能精准识别故障点,还能生成修复方案的3D模型和语音操作指南;在医疗场景中,它可以同时分析患者的CT影像、病历文本、听诊音频,给出包含用药建议的完整诊断报告。
据Altman透露,GPT-5的训练数据集规模是GPT-4的3倍以上,其中多模态数据占比超过60%,涵盖公开授权的学术数据集、企业合作的行业专属数据,以及通过合规渠道获取的通用场景数据。为解决不同类型数据的语义对齐难题,OpenAI优化了跨模态注意力机制,能将音频中的情绪特征与文本情感描述精准匹配,将视频的动作序列与3D建模的空间结构一一对应,真正实现“看懂、听懂、生成所有信息”的全域智能。
当然,两大进展也面临诸多挑战。对于开源模型,安全风险是首要考验——开源意味着模型可能被用于生成有害内容、深度伪造等,OpenAI已明确将建立“模型水印+内容检测+社区监控”的三重安全机制;对于GPT-5的完全多模态,数据隐私与合规是核心门槛,尤其是在欧盟AI法案对通用AI严格监管的背景下,OpenAI需为企业用户提供数据本地化部署选项,确保训练数据的合法性。
业内普遍预测,OpenAI的开源模型有望在2025年第三季度正式发布,GPT-5则可能在年底进入小范围内测。随着闭源与开源模型的协同发展,全球AI行业将迎来新一轮技术爆发:中小企的AI应用成本将大幅降低,跨领域创新应用如自动驾驶多传感器决策、数字孪生全场景模拟等将加速落地,智能时代的边界正被持续拓宽。

1 小时前
2026年4月,AI大模型研发商Anthropic在清理平台上泄露的自家源代码过程中出现操作失误,提交的下架申请误伤数千个无关GitHub开源仓库。Anthropic高管随后公开承认事故为人为操作导致,已第一时间撤销绝大多数不当下架通知,目前GitHub已逐步恢复所有被误下架仓库的正常访问权限。

4 小时前
当地时间2026年3月30日,有“HBM之父”之称的韩国科学技术院电气与电子工程学院教授金正浩公开对外表态,当前以英伟达GPU为核心的AI芯片体系即将发生根本性变革,未来高带宽内存(HBM)、高带宽闪存(HBF)将成为计算核心,GPU与CPU将退居配角,这一预判也引发全球半导体行业对存算一体架构落地节奏的广泛讨论。

4 小时前
2026年4月,中国信通院基于新发布的《云端OpenClaw基线能力要求》开展首批安全评估,腾讯公司公关总监张军披露,旗下龙虾特攻队系列的WorkBuddy、QClaw、轻量云OpenClaw、云桌面云手机Claw、ClawPro共5款产品全部通过评估,覆盖功能可信、收费可控等五大核心安全维度,为国内AI龙虾类产品落地树立了安全合规标杆。

4 小时前
2026年4月1日消息,高德正式全量开源全球首个基于统一架构的具身操作基座模型ABot-M0。该模型可作为“通用大脑”适配多种形态的具身机器人,在Libero、Libero-Plus等多个权威基准测试中达到SOTA表现,其中在Libero-Plus基准上任务成功率达80.5%,较此前业界标杆方案Pi0提升近30%。

4 小时前
2026年3月31日,谷歌DeepMind正式推出旗下目前定价最亲民的AI视频生成模型Veo 3.1 Lite。该模型生成速度与此前发布的Veo 3.1 Fast版本持平,生成成本不到后者的一半,720P分辨率视频生成成本低至每秒0.05美元,支持文生视频、图生视频两大核心功能,大幅降低了AI视频创作的准入门槛。

4 小时前
国内大模型厂商智谱日前发布2025年全年业绩公告,全年营收达7.24亿元,同比增长131.9%,经调整净亏损31.82亿元,同比扩大29.1%。其最新推出的GLM-5发布24小时内即获字节、阿里、腾讯等头部大厂接入,国内前10大互联网公司已有9家深度集成GLM系列模型,旗下GLM Coding Plan付费开发者规模突破24.2万。

4 小时前
2026年4月,AI智能体与自动化框架OpenClaw正式发布v2026.3.31版本,俗称“龙虾”框架的该平台首次原生捆绑腾讯QQ机器人作为内置渠道插件。本次更新免去了开发者此前依赖第三方桥接工具的接入流程,实现QQ生态全覆盖,支持多账号配置、安全凭证管理等功能,大幅降低AI智能体接入社交场景的开发门槛。

4 小时前
2026年4月1日,阿里巴巴正式推出图像生成与编辑统一模型Wan2.7-Image,针对当前AI生图领域普遍存在的审美疲劳、标准脸同质化、色彩失控等行业痛点,该模型主打高「活人感」人物生成能力,支持精准色彩调控、3K token超长文本渲染三大核心升级,可实现千人千面的生成效果,大幅提升生图内容的商用适配性。