忠告:由于这个模型会很容易生成日本和海外相关有著作权保护的角色和人物,请严格遵守相关国家的法律法规,不要将其用于商业或者恶意用途,因为会导致相关的侵权等法律法规的风险,请使用者请勿滥用。
1. 模型简介
IllustriousXL 是由韩国企业 OnomaAI 基于 SDXL 模型 kohaku-xl-beta5 进行微调而成的图像生成模型。2024 年 9 月 30 日发布了其 V0.1 版本,迅速受到用户的喜爱,并成为新一代的热门模型。其具有高潜力,适用于绘制各类画风、角色、构图等,且派生模型也逐渐开始登场。目前已有大量用户开始尝试利用该模型进行各类创作,从插画到角色设计,IllustriousXL 的应用领域正在迅速扩展。模型的多样化和灵活性使其在不同风格的艺术创作中均表现出色,尤其适合那些希望生成高质量图像的用户。随着时间的推移,越来越多的派生模型正在被开发,以满足用户对不同类型和风格的图像需求。
在日本,IllustriousXL 通常被称为“イラストリアス”,这让许多某艘船游戏的玩家想起了同名角色。这种亲切的称呼也为模型带来了更高的知名度,使得该模型在动漫爱好者和插画师中获得了更多关注。
2. 模型特性
IllustriousXL 模型基于 Danbooru 的资源进行训练,因此它的提示词语法与 SD1.5 或 Animagine 系列的类似,使用者可以轻松地从这些模型迁移到 IllustriousXL。模型对角色、构图等多方面进行了广泛学习,使其在生成具有多样风格和高品质的图像方面表现出色。得益于丰富的训练数据,IllustriousXL 能够生成符合用户期待的高细节水平和丰富的构图效果的作品,无论是复杂的背景还是多角色的场景,表现力都非常优秀。
2.1 图片生成推荐设置
采样方法:Euler a
采样步数:20-28
CFG:5-7.5
推荐尺寸:与其他 SDXL 模型类似,推荐尺寸为 1024x1024,其他支持的尺寸包括 896x1152、832x1216、768x1344 等。通过这些推荐尺寸,可以帮助生成更加平衡且高质量的图像,同时避免常见的失真问题。
未来版本更新:预计在 V1.0 版本后,学习图像尺寸将增加到 1536x1536,可能会对输出设置带来一些变化。这将为未来版本提供更高的分辨率和更丰富的细节,进一步提升图像的视觉表现力。
3. 学习时的标签顺序
IllustriousXL 在学习时,使用以下标签顺序进行图像的标注:
人物概况(例如:1boy、1girl、no human)
角色名和作品名
分级(例如:general、sensitive、questionable、explicit)
一般元素
艺术家名
质量
年代
这种标签顺序有助于模型更好地理解和处理图像的内容。虽然提示词的顺序不需要完全遵循训练时的标签顺序,但在生成不理想时可以尝试调整顺序,以提升效果。合理的标签顺序有时会对生成图像的整体质量产生显著的影响,尤其是对于一些复杂的场景或多角色画面。
4. 分级系统
IllustriousXL 的分级参考了 Danbooru 的标准,并分为以下四类:
general(一般)
sensitive(敏感)
questionable(可疑)
explicit(明确的成人内容)
想要生成带有更多成人风格的图片时,可以直接加入“explicit”标签。分级系统使得用户可以更好地控制生成内容的尺度和风格,确保图像符合预期的内容类型。
5. 质量标签与推荐
模型在学习时对图像质量进行了分级,通常推荐在提示词中加入上方三种质量标签以提升图像质量,同时可以加入下列负面标签以去除不理想的效果:
推荐质量标签:masterpiece, best quality, good quality
负面质量标签:bad quality, worst quality
此外,模型也支持一些其他质量标签,例如“very aesthetic, absurdres”,这些标签可根据需求进行使用。通过合理使用这些质量标签,用户可以对图像的细节、构图和整体风格进行精细的控制,确保最终生成的作品符合预期。
6. 使用注意事项与提示
负面提示词:推荐使用以下提示词来避免不良图像生成:
lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality,
watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits,
artistic error, username, scan, abstract,
这些负面提示词有助于去除图像中的常见缺陷,例如水印、低分辨率和不完整的细节。
标签之间的空格和下划线区别:IllustriousXL 模型对于空格和下划线的处理是有区分的。许多用户反映,在使用版权角色时,替换下划线为空格往往可以提高成功率。这种问题尤其在学习程度较低的版权角色绘制时表现得尤为明显。特别是一些精细的角色设计和服装标签,空格和下划线的正确使用可以显著影响图像的输出效果。
版权角色绘制技巧:
遵循模型训练时的标签结构。
利用相关的服装、发型标签来增强特定角色的表现力。
在 Danbooru 上查找准确的角色标签,有时角色全名或作品名的拼写错误会导致绘制失败。
学习薄弱的角色可以尝试通过加强标签的权重来提高成功率。
可以通过加入“male focus”来增强男性角色的输出准确性。
多尝试不同的标签组合来调整细节,确保角色和场景的每个部分都能精准地表达出来。
7. IllustriousXL 的独特优势
IllustriousXL 在角色生成方面具有显著优势,即它可以在没有 LoRA 的情况下仅通过标签来绘制大量的已学习角色。与 Animagine 或 Pony 等 SDXL 主流模型相比,IllustriousXL 能够支持更多种类的角色绘制,尤其是基于 Danbooru 资源的学习成果,这使得它在绘制百合或多人图像方面更加轻松和高效。此外,生成所需的标签较少,有助于节省 token,提高其他细节标签的影响力。使用 IllustriousXL 模型生成多角色场景或复杂背景时,用户可以体验到显著的便捷性和高效性。
7.1 模型的局限性
尽管 IllustriousXL 具有极高的灵活性和丰富性,但由于其学习范围较为宽泛,在画风方面稳定性相对较弱。因此,使用该模型时,推荐通过详细的提示词和负面提示词来加强画面的稳定性。同时,也可以考虑使用一些派生模型来弥补这一不足。在复杂场景中,某些细节可能需要多次调整提示词才能获得理想的结果,这需要用户具备一定的耐心和调试能力。