🚀 Z-Image-Turbo——Z-Image的精炼版,仅有8个NFE(功能评估次数)即可匹敌或超越领先竞争对手。它在企业级H800 GPU上提供⚡️亚秒级的推断延迟⚡️,并舒适地安装在16G显存消费级设备中。它在写实图像生成、双语文本渲染(英中)以及严格的教学遵循方面表现出色。
📸 逼真的画质:Z-Image-Turbo 在保持卓越美学质量的同时,提供了强大的写实图像生成。
📖 准确的双语文本渲染:Z-Image-Turbo 擅长准确渲染复杂的中英文本。
💡 提示增强与推理:提示增强器赋予模型推理能力,使其超越表面描述,触及潜在的世界知识。
🧠 创意图像编辑:Z-Image-Edit 展现了对双语编辑指导的深刻理解,实现富有想象力且灵活的图像转换。
🏗️ 模型架构
采用可扩展的单流DiT(S3-DiT)架构。在这种设置中,文本、视觉语义符号和图像VAE符号在序列层面串接,作为统一的输入流,相较于双流方法最大化参数效率。
📈 性能
根据基于Elo的人类偏好评估(AI Arena),Z-Image-Turbo在与其他领先模型中表现出高度竞争力,同时在开源模型中取得了最先进的成绩。





