近日,中国科学院自动化研究所联合武汉人工智能研究院正式推出紫东太初2.0——国内首个全模态多任务大模型,参数规模突破千亿级别。该模型实现了文本、图像、音频、视频等多模态数据的统一理解与生成,多任务处理效率较前代提升40%,有望在智能交互、内容创作、工业质检等数十个场景落地。
在近日的技术发布会上,紫东太初2.0完成了一场极具说服力的跨模态任务演示:仅输入一段“滨海智能码头昼夜作业”的文本描述,模型便在15秒内同步生成了匹配的高清场景图像、专业旁白音频及动态时序视频片段,全程无需调用多个单模态模型协作。这一成果打破了以往多模态AI需要分模块处理的局限。
紫东太初2.0采用自研的“多模态统一表征学习框架”,将文本、图像、音频、视频等不同模态数据映射至同一语义空间,实现了单模型对多模态任务的原生支持。其参数规模突破千亿级别,较1.0版本的百亿参数实现量级跨越;在多模态任务评测中,该模型的跨模态理解准确率较前代提升35%,多任务并发处理效率提升40%。
值得注意的是,模型还支持零样本、少样本学习能力:在工业缺陷检测场景中,仅需10张带标注的缺陷样本图,就能实现98%以上的检测准确率,大幅降低了传统AI模型的训练成本。
当前,多模态大模型已成为全球AI技术攻坚的核心方向。据艾瑞咨询最新报告,2024年国内多模态大模型市场规模将突破80亿元,年复合增长率超120%。除科研机构外,百度文心一言、阿里通义千问、腾讯混元等企业级大模型也纷纷加码多模态能力。
与企业主导的大模型不同,紫东太初系列由中科院自动化所牵头研发,更侧重底层技术的通用性与场景适配性,此前1.0版本已在智慧医疗、智能教育等场景完成试点,累计服务用户超100万人次。
发布会上,项目团队透露,紫东太初2.0已与12家企业达成战略合作,覆盖智能汽车、内容创作、智慧政务三大核心赛道。在智能汽车领域,模型将为车机系统提供“语音+图像+视频”的多模态交互方案;在内容创作领域,为短视频平台提供一站式脚本生成、画面制作、配音合成工具。
此外,团队还计划于2024年第二季度开放通用API接口,降低开发者接入门槛,预计到2024年底,服务的企业客户将突破200家,覆盖15个以上垂直行业。

22 小时前
近期AI编程赛道涌现两类差异化模式:面向专业开发者的AI Coding凭借效率提升等优势展现出广阔应用潜力,而主打“零门槛”面向非专业群体的Vibe Coding虽频传“低成本完成开发”的“奇迹”案例,但行业观察者指出需理性审视其真实能力边界,避免过度追捧。本文将深入解析两类模式的核心差异与发展前景。

1 天前
在2026年巴塞罗那世界移动通信大会(MWC2026)上,高通正式发布全新一代调制解调器及射频系统X105。该产品采用AI赋能的5G Advanced架构,专为下一代智能体AI(Agentic AI)终端打造,实现占板面积减少15%、功耗降低30%的核心突破,同时搭载第五代5G AI处理器,首发支持NR-NTN卫星通信,为智能终端通信技术发展树立新标杆。

1 天前
近日,谷歌对旗下实验性AI创作工具Flow进行重磅升级,将自研图像生成技术Whisk与在线图像工具ImageFX集成其中,打造一站式“AI创意工作室”。升级后的Flow具备统一工作流、风格迁移、动态化编辑等核心功能,用户仅需简单文本指令,即可在几分钟内生成电影质感短片,或将重构AI创意工具的市场竞争格局。

1 天前
2026年3月2日,谷歌宣布对实验性AI创作工具Flow进行大规模功能扩展,将旗下Whisk风格迁移技术、DALL-E级图像模型驱动的ImageFX深度集成其中,打造统一AI创意工作室。用户可在同一界面完成图像生成、风格调整、动效制作全流程,大幅简化创作环节,提升创意落地效率。

1 天前
三星电子近日对外宣布,将在2030年前完成全球生产体系的智能化升级,打造以Agentic AI为核心的“AI工厂”。此次转型依托三星在移动端积累的AI技术,将部署数字孪生系统、分工明确的机器人族群等方案,旨在将移动端AI能力拓展至工业制造领域,大幅提升生产效率与产品质量,引领全球制造业智能化变革,而Galaxy S26系列搭载的Agentic AI技术将成为此次转型的核心基石。

1 天前
2026年3月,商汤旗下办公AI工具「办公小浣熊」正式上线可编辑AI PPT功能,主打“一键生成,页页可改”,精准解决传统AI PPT生成后修改难、易破坏整体风格的行业痛点。用户可通过官网「PPT生成」-「创意模式」体验该功能,全程掌控PPT创作流程,为职场人提升办公效率提供新选择。

1 天前
苹果计划推出全新Core AI框架以替代现有Core ML,整合第三方AI模型与Apple Foundation模型,通过即将发布的OS26及后续版本向开发者开放设备端AI调用能力。同时,该框架将赋能下一代Siri升级为类聊天机器人形态,有望显著提升苹果在智能语音助手市场的竞争力,加速其AI生态布局。

1 天前
2026年MWC全球移动通信大会上,联想正式推出ThinkBook模块化AI PC概念机。这款产品依托自研MagicBay接口实现硬件模块化定制,基础版为14英寸4K OLED屏,可扩展至19英寸双屏工作站,搭载英特尔酷睿Ultra 7 255H处理器,整机重1.34kg。联想明确表示,量产版将重点优化功耗控制与电池容量,其创新设计有望推动AI PC行业迈入个性化定制的全新阶段。