「Cfg Scale」:テキストの再現度 Cfg Scaleはプロンプトの再現度(忠実度)を調整する値
「Steps」:画像生成にかかるノイズ除去の回数 Stepsの回数を増やすと、明かりがより細かく描かれました
「Number of Images」:生成する画像の枚数
「Sampler」:ノイズ除去を行うアルゴリズムの指定
「Model」:Stable Diffusionのバージョン
「Seed」:画像生成に使用する乱数の初期値
Steps: 20
Sampler: DPM++ SDE Karras
CFG scale: 6.5
Seed: 271120991
Face restoration: CodeFormer
Size: 800×424
Model: chilloutmix_NiPrunedFp32Fix
Denoising strength: 0.7
Hires upscale: 1.5
Hires upscaler: Latent
torch を有効にする CUDA
Nvidia のドライバをインストールしないとCUDAが有効にならない
Extras
ENSD: 31337, Size: 640×896, Seed: , , Model hash: 304c2ec3a6
variationstrength
最後に、新しく表示される「Variation strength」の値(図の3)を変更しましょう。
この値を大きくするほど、元のイラストとかけ離れたイラストが生成されます。
0.1程度に設定しておくことで、元のイラストと微妙に違うものを生成してくれるのでおすすめです。
Hires. fix アップスケーリング機能
プロンプトが定まり、構図が決まってきたら高解像度化していきます。Hires,fixにチェックを入れて、
アップスケーラーを決めます。
画像品質が高くなる手法ほど処理スピードは遅くなり、ESRGAN系は品質が高く処理も遅いです。アニメーション画像には、R-ESRGAN 4x+Anime6Bが向いている
画像品質が単純な手法ほど処理スピードは速いです。Latent系は処理が速い
Stable Diffusion Webui(AUTOMATIC1111)のアップスケーリング機能Hires.fix(ハイレゾ化)のアルゴリズム(アップスケーラー)全14種類あるらしいな。
Hiresfix
Hires. fixはざっくり言うと、低解像度(768×512とか)で出力された画像を1.5倍とかに引き伸ばした画像に対するimage2imageです。
Upscaler(アップスケーラー)
:14種類くらいある。
参考記事
↑を見たら、
Latent (nearest)
SwinIR 4x
のどちらかだな、他のは、真後ろから子供が描いたみたいな絵になっちゃうのに対して、立体を意識した絵になるし、手にもうごきがあってすこし感情表現がされてる気がする。
AIグラビアなどのフォトリアル系ではESRGAN_4x←おすすめ
Hires steps:アップスケーリング時のsteps数。多分steps数が多いほど緻密になる
Hires steps:40 ←おすすめ
Denoising strength(ノイズ除去度)
:アップスケーリングの元となる画像からどの程度ノイズ除去するか。ここの値を小さくするとアップスケール後に元画像とかけ離れた画像になりやすい
Denoising strength(ノイズ除去度)0.7がいい。←おすすめ。滑らかにアップスケールされる
Upscale by(アップスケール倍率):何倍に拡大するか←1.5~2倍がおすすめ