注意事項:このモデルは、日本や海外で著作権保護されているキャラクターや人物を生成しやすいため、関連する国の法律および規制を厳守し、商業的または悪意のある用途には使用しないでください。侵害などの法的リスクを引き起こす可能性があるため、ユーザーは悪用されないようご注意ください。
1. モデル概要
IllustriousXLは、韓国の企業OnomaAIがSDXLモデルkohaku-xl-beta5を基に微調整した画像生成モデルです。2024年9月30日にV0.1がリリースされ、すぐにユーザーに人気を博し、新世代のホットなモデルとなりました。非常に高い潜在能力を持ち、様々な画風やキャラクター、構図の描画に適しており、派生モデルも徐々に登場し始めています。現在、多くのユーザーがこのモデルを使ってイラストやキャラクターデザインなど様々な創作を試みており、IllustriousXLの利用範囲は急速に広がっています。その多様性と柔軟性により、さまざまなスタイルの芸術的な創作で優れたパフォーマンスを発揮しており、高品質な画像を生成したいと考えているユーザーに最適です。時間が経つにつれて、異なる種類やスタイルの画像に対するニーズを満たすため、ますます多くの派生モデルが開発されています。
日本では、IllustriousXLは「イラストリアス」として知られており、特定の船のゲームのキャラクターを連想するプレイヤーも多いです。この親しみのある名称により、モデルはアニメ愛好者やイラストレーターの間で高い注目を集めています。
2. モデルの特性
IllustriousXLはDanbooruのリソースを使ってトレーニングされており、そのプロンプトの書き方はSD1.5やAnimagineシリーズと類似しています。このため、これらのモデルからIllustriousXLへの移行が容易です。モデルはキャラクターや構図など多方面にわたり幅広く学習しており、様々なスタイルや高品質な画像を生成する上で優れたパフォーマンスを示します。豊富なトレーニングデータのおかげで、IllustriousXLはユーザーが期待する高い細部と豊かな構図効果を持つ作品を生成でき、複雑な背景や多キャラクターのシーンでも素晴らしい表現力を持っています。
2.1 画像生成の推奨設定
サンプリング方法:Euler a
サンプリングステップ:20-28
CFG:5-7.5
推奨サイズ:他のSDXLモデルと同様に、推奨サイズは1024x1024、他のサポートされているサイズには896x1152、832x1216、768x1344などがあります。これらの推奨サイズを使うことで、バランスが取れた高品質な画像を生成し、一般的な歪みの問題を回避するのに役立ちます。
将来のバージョンの更新:V1.0バージョン以降、学習画像サイズは1536x1536に拡大される予定で、出力設定にいくつかの変更がある可能性があります。これにより、将来のバージョンではより高い解像度と豊かな詳細が提供され、画像のビジュアルパフォーマンスがさらに向上します。
3. 学習時のタグ順序
IllustriousXLは学習時、以下の順序で画像にタグ付けを行いました。
人物概要(例:1boy、1girl、no human)
キャラクター名と作品名
分類(例:general、sensitive、questionable、explicit)
一般要素
アーティスト名
クオリティ
年代
このタグ順序は、モデルが画像の内容をよりよく理解し処理するのに役立ちます。プロンプトの順序が学習時のタグ順序と完全に一致する必要はありませんが、生成がうまくいかない場合には順序を調整してみることで効果が上がる場合があります。合理的なタグ順序は、特に複雑なシーンや多キャラクターの画面で、画像の全体的な品質に大きな影響を与えることがあります。
4. 分類システム
IllustriousXLの分類はDanbooruの基準に準拠しており、以下の4つに分類されています。
general(一般)
sensitive(センシティブ)
questionable(疑わしい)
explicit(明確な成人向け内容)
成人向けのスタイルの画像を生成したい場合は、「explicit」タグを直接追加することができます。この分類システムにより、ユーザーは生成される内容のスケールとスタイルをよりよくコントロールし、期待に合ったコンテンツタイプの画像を確保できます。
5. クオリティタグと推奨
モデルは学習時に画像品質を分類しており、通常、プロンプトに上記の3つのクオリティタグを追加して画像の品質を向上させることが推奨されます。また、以下のネガティブタグを使用して理想的でない効果を除去することができます。
推奨クオリティタグ:masterpiece, best quality, good quality
ネガティブクオリティタグ:bad quality, worst quality
さらに、モデルは「very aesthetic, absurdres」などの他のクオリティタグもサポートしており、必要に応じて使用することができます。これらのクオリティタグを適切に使用することで、ユーザーは画像の細部、構図、全体的なスタイルを細かくコントロールし、最終的に生成される作品が期待に沿うようにすることができます。
6. 使用上の注意とヒント
ネガティブプロンプト:以下のプロンプトを使用して、望ましくない画像の生成を回避することが推奨されます。
lowres, (bad), text, error, fewer, extra, missing, worst quality, jpeg artifacts, low quality,
watermark, unfinished, displeasing, oldest, early, chromatic aberration, signature, extra digits,
artistic error, username, scan, abstract,
これらのネガティブプロンプトは、画像内の一般的な欠陥(例えばウォーターマーク、低解像度、不完全な細部など)を取り除くのに役立ちます。
タグのスペースとアンダーバーの区別:IllustriousXLは、スペースとアンダーバーの処理に違いがあります。多くのユーザーが、著作権キャラクターを使用する際、アンダーバーをスペースに置き換えることで成功率が向上すると報告しています。この問題は、特に学習の程度が低い著作権キャラクターを描画する際に顕著です。特に精細なキャラクターデザインや服装のタグで、スペースとアンダーバーを正しく使用することで、画像の出力効果に大きな影響を与えることがあります。
著作権キャラクター描画のコツ:
モデル学習時のタグ構造に従う。
関連する服装や髪型のタグを使って特定キャラクターの表現力を強化する。
Danbooruで正確なキャラクタータグを探す。キャラクターのフルネームや作品名のスペルミスが、描画失敗の原因になることがあります。
学習が弱いキャラクターは、タグの重みを強化することで出力精度を向上させることができます。
「male focus」を追加することで、男性キャラクターの出力精度を向上させることが可能です。
異なるタグの組み合わせを多く試して、キャラクターとシーンの各部分を正確に表現できるよう調整します。
7. IllustriousXLの独自の利点
IllustriousXLは、キャラクター生成の面で顕著な利点があります。それは、LoRAを使用せずに大量の学習済みキャラクターをタグのみで描画できる点です。AnimagineやPonyなどのSDXLの主流モデルと比べて、IllustriousXLはより多くのキャラクターの描画をサポートしています。特にDanbooruのリソースを基にした学習成果により、百合や複数キャラクターの画像を簡単かつ効率的に生成することが可能です。また、生成に必要なタグが少ないため、トークンを節約でき、他の細部タグの影響力も向上します。IllustriousXLを使って多キャラクターのシーンや複雑な背景を生成する際、ユーザーはその利便性と効率性を体験することができます。
7.1 モデルの限界
IllustriousXLは非常に高い柔軟性と多様性を持っていますが、その学習範囲が広いため、画風の安定性が相対的に弱い面があります。そのため、このモデルを使用する際には、詳細なプロンプトとネガティブプロンプトを使って描画の安定性を強化することが推奨されます。また、一部の派生モデルを使用して、この不安定さを補うことも検討できます。複雑なシーンでは、理想的な結果を得るためにプロンプトを何度も調整する必要がある場合があり、ユーザーにはある程度の忍耐と調整能力が求められます。