近日,中国科学院自动化研究所联合武汉人工智能研究院正式推出紫东太初2.0——国内首个全模态多任务大模型,参数规模突破千亿级别。该模型实现了文本、图像、音频、视频等多模态数据的统一理解与生成,多任务处理效率较前代提升40%,有望在智能交互、内容创作、工业质检等数十个场景落地。
在近日的技术发布会上,紫东太初2.0完成了一场极具说服力的跨模态任务演示:仅输入一段“滨海智能码头昼夜作业”的文本描述,模型便在15秒内同步生成了匹配的高清场景图像、专业旁白音频及动态时序视频片段,全程无需调用多个单模态模型协作。这一成果打破了以往多模态AI需要分模块处理的局限。
紫东太初2.0采用自研的“多模态统一表征学习框架”,将文本、图像、音频、视频等不同模态数据映射至同一语义空间,实现了单模型对多模态任务的原生支持。其参数规模突破千亿级别,较1.0版本的百亿参数实现量级跨越;在多模态任务评测中,该模型的跨模态理解准确率较前代提升35%,多任务并发处理效率提升40%。
值得注意的是,模型还支持零样本、少样本学习能力:在工业缺陷检测场景中,仅需10张带标注的缺陷样本图,就能实现98%以上的检测准确率,大幅降低了传统AI模型的训练成本。
当前,多模态大模型已成为全球AI技术攻坚的核心方向。据艾瑞咨询最新报告,2024年国内多模态大模型市场规模将突破80亿元,年复合增长率超120%。除科研机构外,百度文心一言、阿里通义千问、腾讯混元等企业级大模型也纷纷加码多模态能力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
4 小时前
2026年5月15日,QQ浏览器与腾讯元宝联合发布高考场景专属AI技能,首批上线地区分数线查询、一分一段查询核心功能,同时计划推出行业首个高考咨询师Agent“元宝高考通”。产品整合教育在线·掌上高考官方权威招考数据,旨在解决全国超1300万高考考生志愿填报普遍存在的信息差与数据可信度痛点。

4 小时前
2026年5月,全球AI技术测评团队完成了面向软件开发场景的AI Agent专项基准测试,本次测试覆盖市面上17款主流商用、开源AI Agent产品,覆盖代码生成、漏洞修复、架构设计三大核心开发场景,DeepSeek Dev Agent、OpenAI GPT-4o Coding Agent、Code...

5 小时前
硬件厂商驰为(Chuwi)近期推出旗下首款搭载微软Copilot+功能的轻薄本CoreBook Air,主打超轻机身与亲民定价,目标瞄准大众级AI PC市场。目前主流Copilot+轻薄本首发价普遍在7000元以上,该产品有望将AI PC入门门槛拉低至3000元档位,填补了高性价比Copilot+便携设备的市场空白。

6 小时前
近日全球头部硬件厂商戴尔正式扩展旗下AI PC产品线,推出14s、16s两款轻薄型AI PC新品,两款机型均适配微软Copilot AI助手,搭载支持本地大语言模型运算的专用NPU算力模块,主打消费级AI办公、轻创意生产场景,定价覆盖中端主流市场,有望进一步拉动全球消费级AI PC的市场渗透率。

11 天前
近日,华硕正式推出面向专业创意群体的ProArt PZ14移动创意本,产品搭载高通第三代骁龙X2 Elite计算平台,配备14英寸144Hz高刷OLED专业触控屏,45TOPS端侧AI算力可原生运行Stable Diffusion、Adobe Firefly等主流AI创作工具,无需云端传输即可完成AI绘图、视频智能剪辑等操作,填补了高端ARM架构AI创意本的市场空白。

14 天前
OpenAI在2026年初推出的新一代AI图像生成工具ChatGPT Images 2.0近期在印度市场收获爆发式增长,当地用户大量使用其生成虚拟 avatar、电影感人像、商业宣传图等创意内容,上线首月印度区付费用户占该产品全球新增付费用户的62%,但目前该产品在欧美、东南亚等其他区域的市场渗透率仍不足3%,尚未打开全球主流市场局面。

14 天前
近日,全球云基础设施服务商Cloudflare推出支持AI Agent接管云资源配置、账单核算、服务部署等核心运维权限的解决方案,相关测试数据显示该模式可将企业云运维效率提升42%,但方案也引发行业对云治理权限边界、责任认定、支出管控等问题的广泛讨论。

14 天前
2026年4月披露的行业信息显示,苹果旗下搭载M4系列AI加速芯片的Mac mini、Mac Studio、Mac Neo三款专业机型,受端侧AI算力需求爆发拉动,销量远超官方此前预期。苹果已确认下季度上述产品将处于供应受限状态,本次供需缺口也凸显出端侧AI落地后消费级专业算力硬件的市场缺口正在快速扩大。