
11 天前
2026年,清华大学与香港科技大学联合团队完成的AI图像生成技术研究成果MoKus正式上传至学术预印本平台arXiv,论文编号为arXiv:2603.12743v1。该技术突破了现有AI图像生成工具长序列内容叙事连贯性不足、记忆点易丢失的行业痛点,首次实现图像生成领域的记忆化叙事理解能力,为AI内容创作、影视工业化等场景提供了全新技术路径。

1 个月前
2026年2月27日,Google正式在Gemini App中推出新一代图像生成模型Nano Banana 2(技术名Gemini 3.1 Flash Image)。该模型首次将Pro级图像质量与Flash级极速响应结合,默认输出2K分辨率图像,同时大幅优化文字渲染效果,用户无需额外操作,在App内选择图片生成功能即可直接使用,兼顾创作质量与效率。

1 个月前
2026年2月26日,谷歌正式发布新一代图像生成模型Nano Banana 2,官方数据显示其图像生成速度较前代提升45%,同时保持了旗舰级生成画质。该模型即将成为Gemini应用及内置AI模式的默认工具,覆盖全设备场景,为全球数亿Gemini用户带来更流畅的AI创作体验。

49 分钟前
近期,由多位OpenAI前核心员工发起的风投基金Zero Shot正式启动,首期基金目标募资规模为1亿美元,目前已完成多个早期项目的投资交割。该基金团队均拥有大语言模型、通用人工智能(AGI)领域的一线研发与产业经验,未来将重点投向AI创新赛道的早期创业项目,填补AGI细分领域的早期投资缺口。

1 小时前
微软旗下开源代码编辑器Visual Studio Code于近期推送1.114正式版本更新,针对内置的GitHub Copilot AI功能完成多项体验升级,包括为AI聊天上下文菜单新增「复制最终回复」命令、简化Copilot跨代码库检索流程,同时新增图片轮播组件的视频预览能力,进一步降低开发者调用AI辅助编程的操作成本。

4 小时前
2026年4月,谷歌低调推出面向iOS系统的离线优先AI听写应用,该产品搭载谷歌自研轻量级开源大模型Gemma,主打无网络环境下高准确率语音转写功能,直指当前听写赛道头部产品Wispr Flow,是谷歌在C端AI工具轻量化落地的最新动作,填补了其移动端离线语音交互产品的布局空白。

4 小时前
当地时间2026年4月,随着美伊军事冲突持续升级,伊朗方面公开宣称将对与美国存在关联的Stargate AI数据中心发起针对性导弹打击。该事件首次将大规模民用AI算力基础设施直接纳入地缘冲突打击目标范畴,引发全球AI产业对数据中心安全布局的广泛担忧,也对全球AI算力供给稳定性带来潜在冲击。

5 小时前
2026年4月,MIT Technology Review刊发行业报道,经济学家公开呼吁全球启动类“曼哈顿计划”的跨学科专项研究,破解当前AI渗透职场过程中就业影响数据零散、口径不统一的行业痛点,填补大语言模型、生成式AI等技术落地过程中的就业评估空白,为政策制定、企业用工调整、从业者职业规划提供可落地的量化参考依据。