ハダノ元教頭が GIGAスクール と DX人材育成 について考えるブログ
AIが高速で進化する中、今までできなかったことができるようになりました。文章生成AIや画像生成AIは、革命的なテクノロジーです。
「生成AIをちょっとさわってみたけど、実用的じゃない」と言う人たちは、部活動でいうと見学・体験入部で見切りをつけています。道具を揃えノックを受け続けて、だんだん楽しめるようになってきます。
今回お届けするのは……
第1回の記事で述べた画像生成AIをローカル実行する利点
を深掘りしてみます。
人気の拡張機能を調べ、優先度の高いものから試してみることにしました。 → 🔗【Stable Diffusion】WebUIに必ず導入したいおすすめの拡張機能40選+α【Extensions】
に従って、Enable Checker をインストールしました。
ついでに、
で、設定メニューの深い階層にもぐらなくても ”VAE”と”Clip skip” を変更できるようにしました。
これで、Stable Diffusionの操作がしやすくなりました。
に従って、text2prompt をインストールしました。
< 作例1 >
head biting, rape face, halloween, date pun, pumpkin costume, evil smile, naked pumpkin, full-face blush, surprise kiss, pumpkin, gothic, pumpkin mask, dia de muertos, upside-down kiss, straw doll, purple nightgown, werewolf, halloween costume, wolf mask, brown lips
< 作例2 >
trick or treat, ghost costume, pumpkin mask, wolf mask, naked pumpkin, surprise kiss, pumpkin costume, happy halloween, oni, clown mask, brown lips, easter, missing tooth, ii fuufu no hi, date pun, jack-o'-lantern, full-face blush, demon parade, pumpkin, halloween costume
「ハロウィンの夜」 作例1 と 作例2 の生成画像
ちょっとおどろおどろしい感じです。
EasyNegative, (worst quality, low quality: 2.0), normal quality, ugly face, unclear eyes, bad mouth, bad anatomy, extra legs, bad anatomy
というネガティブプロンプトを入れ、きれいめの「ハロウィンの夜」を生成してみました。
同じモデル(yayoi_mix)なのに、けっこう雰囲気が変わります。
注意点として、
ということを知っておく必要があります。
プロンプトのランダム生成 × 画像のランダム生成 の組み合わせで、かなりのバリエーションが生まれます。ネガティブプロンプト・解像度・モデルによってさらにバリエーションが豊かになります。
バリエーション豊かな画像が生成されるのはよいことですが、「キャラクターに一貫性を持たせる」のは難しくなります。
自分の思い通りの画像を作りたいときに助けとなるのが、LoRA です。→ 🔗思い通りの画像を LoRA を使って生成する方法【18選】
既存のモデルに新たな画像を追加学習させた LoRA のファイル を自作できれば、特定の人物を主人公にできます。
に従って、sd-webui-train-tools をインストールしました。
新たに作られた Train Tools タブ に切り換えました。
ハダノが個人的に最も推している(最推し)、アマチュア鍵盤奏者kemi の写真を12枚用意しました。ふだんよく使うモデルのyayoi_mix をベースに12枚の写真を追加学習させました。
エラーが出やすいと言われる sd-webui-train-tools ですが、Begin train ボタン をクリックして待つこと20分、、、無事に LoRA のファイル ができあがりました。Use xformers のチェックをはずしておいたのがよかったようです。
outputs\train_tools\projects\kemi\versions\v1\trains\yayoiMix_v20-bs-1-ep-20-op-Lion-lr-0_0001-net-128-ap-64
フォルダ の中の
kemi-v1.safetensors を
models\Lora
フォルダ へコピーしておきます。
いよいよ、自作LoRAを使って最推しのコスプレグラビアを作ります。顔だけ適用できれば十分なので、
に従って、拡張機能 After Detailer をインストールしました。
Enable ADetailer のチェックを入れ、model に mediapipe_face_full を指定しました。
ADetailer prompt 欄 に
<lora:kemi-v1:1>
を入力して、Generate ボタン をクリックしますが、サイケデリックな顔になってしまって失敗です。
気を取り直して、ADetailer negative prompt 欄 に
ugly
を入力し、LoRAの重みを
<lora:kemi-v1:0.7>
で7割にすると、いい感じになりました。
コスプレの出来ばえにプラスして、推しのイメージに合うかどうかもチェックしたい場合、どうしてもガチャの回数が増えます。なんとか自動でガチャを回し続ける方法はないかと考えていたら、ピッタリの拡張機能がありました。
に従って、拡張機能 Generate forever をインストールしました。
Generate ボタン の下に追加された Generate Forever ボタン と Cancel Forever ボタン によって、自動でガチャを回す/止める が簡単にできるようになりました。
ガチャは、何が出るかわからないワクワクがあります。無料で無限にガチャを回せる Generate forever は最高です。
「ビーチを飛んでいる妖精」のガチャを回し続けて、イメージにぴったりの一枚を選びました。
< LoRA適用前 >
< LoRA適用後 >
オタクの夢、ついに実現です。
画像生成AIをローカル実行する利点(その2)いろんな拡張機能を入れられる を生かそうと、5つの拡張機能をインストールしてみました。
特に、sd-webui-train-tools は、超簡単にLoRAを自作できる夢のような拡張機能でした。追加学習がエラーなく短時間で実行できたのは、PCの性能のおかげです。推しの画像データを外部に流出させることなく安全にLoRAファイルを作れたのは、ローカル実行ならではです。
長男は幼稚園のとき、「パパはコンピュータでなんでもつくれるよ」と言っていました。当時はネットでひろった画像をアイロンプリントしたキャラクターシャツでお茶を濁していました。画像生成AIによってこれが本当になりました。
また、いろいろ試してみようと思います。
PCの機能アップも着々と進んでいます。
🔗パソコン工房の LEVEL-R779-LC137KF-UL2X は、無線機能・光学ドライブがついていないので、周辺機器をつなぎました。