Z-Image-Turbo-BF16

CHECKPOINT
Reprint


Updated:

🚀 Z-Image-Turbo——Z-Image的精炼版,仅有8个NFE(功能评估次数)即可匹敌或超越领先竞争对手。它在企业级H800 GPU上提供⚡️亚秒级的推断延迟⚡️,并舒适地安装在16G显存消费级设备中。它在写实图像生成、双语文本渲染(英中)以及严格的教学遵循方面表现出色。

📸 逼真的画质:Z-Image-Turbo 在保持卓越美学质量的同时,提供了强大的写实图像生成。

📖 准确的双语文本渲染:Z-Image-Turbo 擅长准确渲染复杂的中英文本。

💡 提示增强与推理:提示增强器赋予模型推理能力,使其超越表面描述,触及潜在的世界知识。

🧠 创意图像编辑:Z-Image-Edit 展现了对双语编辑指导的深刻理解,实现富有想象力且灵活的图像转换。

🏗️ 模型架构

采用可扩展的单流DiT(S3-DiT)架构。在这种设置中,文本、视觉语义符号和图像VAE符号在序列层面串接,作为统一的输入流,相较于双流方法最大化参数效率。

📈 性能

根据基于Elo的人类偏好评估(AI Arena),Z-Image-Turbo在与其他领先模型中表现出高度竞争力,同时在开源模型中取得了最先进的成绩。

Version Detail

Z-Image-Turbo
8
🚀 Z-Image-Turbo——Z-Image的精炼版,仅有8个NFE(功能评估次数)即可匹敌或超越领先竞争对手。它在企业级H800 GPU上提供⚡️亚秒级的推断延迟⚡️,并舒适地安装在16G显存消费级设备中。它在写实图像生成、双语文本渲染(英中)以及严格的教学遵循方面表现出色。 📸 逼真的画质:Z-Image-Turbo 在保持卓越美学质量的同时,提供了强大的写实图像生成。 📖 准确的双语文本渲染:Z-Image-Turbo 擅长准确渲染复杂的中英文本。 💡 提示增强与推理:提示增强器赋予模型推理能力,使其超越表面描述,触及潜在的世界知识。 🧠 创意图像编辑:Z-Image-Edit 展现了对双语编辑指导的深刻理解,实现富有想象力且灵活的图像转换。 🏗️ 模型架构采用可扩展的单流DiT(S3-DiT)架构。在这种设置中,文本、视觉语义符号和图像VAE符号在序列层面串接,作为统一的输入流,相较于双流方法最大化参数效率。 📈 性能根据基于Elo的人类偏好评估(AI Arena),Z-Image-Turbo在与其他领先模型中表现出高度竞争力,同时在开源模型中取得了最先进的成绩。

Project Permissions

Model reprinted from :

Reprinted models are for communication and learning purposes only, not for commercial use. Original authors can contact us to transfer the models through our Discord channel --- #claim-models.

Related Posts