2026年3月18日,AI文生图工具Midjourney正式推出V8模型早期测试版本,本次架构升级实现图像生成速度较前代提升5倍,新增原生2K渲染、图像连贯性增强等功能,文本指令遵循度与内嵌文本渲染准确率均有显著提升。不过该版本仍沿用纯扩散模型路线,在复杂抽象指令处理上弱于谷歌、OpenAI的混合架构竞品。
不少Midjourney核心用户已经发现,3月18日起官方Alpha测试站已经上线了V8模型的调用入口,不少提前体验的用户在社交平台晒出了仅需10余秒生成的2K分辨率高清作品,对比前代V7动辄半分钟以上的生成耗时,流畅度提升感知十分明显。
本次V8是Midjourney近两年最大的一次架构更新,没有跟风行业流行的“扩散+自回归”混合架构,仍然坚持100%纯扩散模型路线。
这次更新带来的核心提升除了5倍生成速度之外,还新增了专门的--hd模式,支持原生2K分辨率图像输出,不需要用户后期再做放大处理,避免了放大带来的细节失真问题。同时新增的--q4参数,可以自动对齐同一系列生成作品的风格、色调、人物设定,大幅降低多图连载、系列海报创作的后期调整成本。
针对用户吐槽已久的“文生图内嵌文字乱码”问题,V8新增了引号识别机制,用户只要把需要出现在图像里的文本内容放在英文引号中,渲染准确率可以提升到85%以上。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
18 小时前
2026年5月15日,百度正式宣布成立百度模型委员会(简称BMC),全面统筹公司大模型全链路研发与落地工作。原基础模型研发部(BMU)、应用模型研发部(AMU)均调整为向BMC汇报,此次架构调整标志着百度大模型战略正式进入技术应用一体化的高效推进阶段,核心团队由顶尖青年研究员与资深工程领袖组成。

20 小时前
近日,人工智能企业Anthropic旗下大模型产品Claude正式拿下此前被马斯克创办的xAI旗下Grok列为首要需求的北美核心IDC资源,本次交易涉及的算力规模约合12万块H100芯片当量,将直接支撑Claude 3系列产品下一阶段的迭代与商业化落地,也让全球头部大模型厂商的算力争夺战进入更为白热化的阶段。

13 天前
美国电影艺术与科学学院(奥斯卡主办方)近日正式更新2025届奖项评选规则,明确AI生成的表演内容、AI独立创作的剧本均不具备奥斯卡表演类、编剧类奖项的参评资格。本次规则调整是好莱坞官方首次就AI创作的奖项归属给出明确界定,回应了2023年以来好莱坞编剧、演员工会罢工中提出的AI创作权益划分核心诉求。

13 天前
美国电影艺术与科学学院于2026年5月正式更新奥斯卡参评规则,明确所有完全由AI生成的演员表演、剧本内容均不具备参评资格。该新规针对近期全球影视行业AI创作泛滥的趋势出台,也对知名AI影视制作人Tilly Norwood此前申报的全AI制作参评作品直接构成影响。

14 天前
2026年5月2日,微软通过美国Frontier计划正式推出面向法律专业人士的定制化AI工具“法律助手”,该产品深度集成于Word办公环境,依托与法律专家联合研发的专属算法而非通用大模型,可实现合同风险标注、跨版本比对、合规校验等功能,大幅简化合同处理流程,为垂直领域AI应用落地提供了新的参考路径。

16 天前
2026年4月29日,A股上市教育企业豆神教育(300010.SZ)正式发布2025年年度报告,全年实现营业收入10.06亿元,同比增长32.96%。本次业绩增长核心动力来自公司深耕的“AI+教育”战略,自主研发的“豆神AI”大模型打通技术到应用全链路,目前已初步构建起“软件+硬件+服务”三位一体的AI教育生态闭环。

17 天前
2026年4月29日公开的SuperCLUE最新文生图模型评测结果显示,OpenAI于4月21日上线的新一代文生图模型GPT Image 2,正式超越谷歌此前的榜首产品Nano Banana2登顶全球第一。该模型在画质、指令理解、细节还原维度均实现突破,尤其汉字生成板块获93.07分、文字准确度满分,解决了海外模型汉语文本生成的长期痛点。

17 天前
2026年4月28日,伦敦帝国理工学院、互联网档案馆与斯坦福大学联合发布研究报告,对2022至2025年33个月的网页样本分析显示,截至2025年中期全球35%新发布网站内容全部或部分由AI生成,较2022年底ChatGPT发布前的近乎零占比实现爆发式增长,AI内容语义相似度较人类原创高33%,正深度改变互联网话语体系。