ハダノ元教頭が GIGAスクール と DX人材育成 について考えるブログ

見せてもらおうか、生成AI用PCの性能とやらを―3
イノベーションAI先端技術CGDX推進

見せてもらおうか、生成AI用PCの性能とやらを―3

🕓 10/16/2023 ↻ 11/3/2023

 AIが高速で進化する中、今までできなかったことができるようになりました。文章生成AIや画像生成AIは、革命的なテクノロジーです。

 「生成AIをちょっとさわってみたけど、実用的じゃない」と言う人たちは、部活動でいうと見学・体験入部で見切りをつけています。道具を揃えノックを受け続けて、だんだん楽しめるようになってきます。


 今回お届けするのは……

Stable Diffusionの拡張機能で推しのグラビア生成に挑戦してみた


 第1回の記事で述べた画像生成AIをローカル実行する利点

  • (その2)いろんな拡張機能を入れられる

を深掘りしてみます。

 人気の拡張機能を調べ、優先度の高いものから試してみることにしました。 → 🔗【Stable Diffusion】WebUIに必ず導入したいおすすめの拡張機能40選+α【Extensions】


現在有効化している拡張機能を色分けして見やすく

に従って、Enable Checker をインストールしました。

 ついでに、

で、設定メニューの深い階層にもぐらなくても ”VAE”と”Clip skip” を変更できるようにしました。

 これで、Stable Diffusionの操作がしやすくなりました。


簡単な単語から類推して自動でプロンプトを

に従って、text2prompt をインストールしました。

text2prompt
  1. Text2Prompt タブ に切り替える。
  2. Input Theme 欄に 出したいイメージの英単語を入れる。Google翻訳Chrome拡張などで翻訳すると便利。
  3. Input Negative Theme 欄に 出したくないイメージの英単語を入れる。
  4. Generate ボタン をクリック。クリックするたびに違うプロンプトが Output 欄に出力される。
  5. Send to txt2img ボタン をクリックで txt2img タブ に切り替わり、プロンプト欄に送られる。

< 作例1 >

head biting, rape face, halloween, date pun, pumpkin costume, evil smile, naked pumpkin, full-face blush, surprise kiss, pumpkin, gothic, pumpkin mask, dia de muertos, upside-down kiss, straw doll, purple nightgown, werewolf, halloween costume, wolf mask, brown lips

< 作例2 >

trick or treat, ghost costume, pumpkin mask, wolf mask, naked pumpkin, surprise kiss, pumpkin costume, happy halloween, oni, clown mask, brown lips, easter, missing tooth, ii fuufu no hi, date pun, jack-o'-lantern, full-face blush, demon parade, pumpkin, halloween costume

「ハロウィンの夜」 作例1 と 作例2 の生成画像

ハロウィンの夜

 ちょっとおどろおどろしい感じです。

EasyNegative, (worst quality, low quality: 2.0), normal quality, ugly face, unclear eyes, bad mouth, bad anatomy, extra legs, bad anatomy

 というネガティブプロンプトを入れ、きれいめの「ハロウィンの夜」を生成してみました。

きれいめのハロウィンの夜

 同じモデル(yayoi_mix)なのに、けっこう雰囲気が変わります。

 注意点として、

  • Text2Prompt タブ の Generate ボタン は、(通常の)プロンプトをランダム生成するもの。ネガティブプロンプトは生成しない。
  • txt2img タブ の Generate ボタン は、画像をランダム生成するもの。

ということを知っておく必要があります。

 プロンプトのランダム生成 × 画像のランダム生成 の組み合わせで、かなりのバリエーションが生まれます。ネガティブプロンプト・解像度・モデルによってさらにバリエーションが豊かになります。


既存のモデルに新たな画像を追加学習させた LoRA のファイル を自作

 バリエーション豊かな画像が生成されるのはよいことですが、「キャラクターに一貫性を持たせる」のは難しくなります。

 自分の思い通りの画像を作りたいときに助けとなるのが、LoRA です。→ 🔗思い通りの画像を LoRA を使って生成する方法【18選】


 既存のモデルに新たな画像を追加学習させた LoRA のファイル を自作できれば、特定の人物を主人公にできます。

に従って、sd-webui-train-tools をインストールしました。

 新たに作られた Train Tools タブ に切り換えました。

Train ToolsでLoRAを自作

 ハダノが個人的に最も推している(最推し)、アマチュア鍵盤奏者kemi の写真を12枚用意しました。ふだんよく使うモデルのyayoi_mix をベースに12枚の写真を追加学習させました。

 エラーが出やすいと言われる sd-webui-train-tools ですが、Begin train ボタン をクリックして待つこと20分、、、無事に LoRA のファイル ができあがりました。Use xformers のチェックをはずしておいたのがよかったようです。


outputs\train_tools\projects\kemi\versions\v1\trains\yayoiMix_v20-bs-1-ep-20-op-Lion-lr-0_0001-net-128-ap-64 フォルダ の中の

kemi-v1.safetensors を

models\Lora フォルダ へコピーしておきます。


自作LoRA を顔だけに適用

 いよいよ、自作LoRAを使って最推しのコスプレグラビアを作ります。顔だけ適用できれば十分なので、

に従って、拡張機能 After Detailer をインストールしました。

After DetailerでLoRAを顔だけに適用

 Enable ADetailer のチェックを入れ、model に mediapipe_face_full を指定しました。

 ADetailer prompt 欄 に <lora:kemi-v1:1> を入力して、Generate ボタン をクリックしますが、サイケデリックな顔になってしまって失敗です。

 気を取り直して、ADetailer negative prompt 欄 に ugly を入力し、LoRAの重みを <lora:kemi-v1:0.7> で7割にすると、いい感じになりました。


自動でガチャを

 コスプレの出来ばえにプラスして、推しのイメージに合うかどうかもチェックしたい場合、どうしてもガチャの回数が増えます。なんとか自動でガチャを回し続ける方法はないかと考えていたら、ピッタリの拡張機能がありました。

  • 🔗【Generate forever】無限に画像を生成できるようになる便利機能の紹介!【Stable Diffusion WebUI】

に従って、拡張機能 Generate forever をインストールしました。

Generate foreverで無限に画像生成ガチャ

 Generate ボタン の下に追加された Generate Forever ボタン と Cancel Forever ボタン によって、自動でガチャを回す/止める が簡単にできるようになりました。


 ガチャは、何が出るかわからないワクワクがあります。無料で無限にガチャを回せる Generate forever は最高です。

Generate foreverで無限に妖精画像生成

 「ビーチを飛んでいる妖精」のガチャを回し続けて、イメージにぴったりの一枚を選びました。

< LoRA適用前 >

LoRA適用前の妖精

< LoRA適用後 >

LoRA適用後の妖精
kemi
えー……? これがわたしですか?
……確かに元の画像と比べると、別人ですね。この美しい天使の顔の7割がわたしなんですね。
ハダノ
天使じゃなくて、妖精ですね。
顔だけをよく見ると、左の口角を上げるクセや各パーツの特徴がよく再現されていると思いますよ。

【結論】Stable Diffusionの拡張機能で、尊い推しのグラビアが生成できる

 オタクの夢、ついに実現です。

 画像生成AIをローカル実行する利点(その2)いろんな拡張機能を入れられる を生かそうと、5つの拡張機能をインストールしてみました。

コンピューターパパ

 特に、sd-webui-train-tools は、超簡単にLoRAを自作できる夢のような拡張機能でした。追加学習がエラーなく短時間で実行できたのは、PCの性能のおかげです。推しの画像データを外部に流出させることなく安全にLoRAファイルを作れたのは、ローカル実行ならではです。

 長男は幼稚園のとき、「パパはコンピュータでなんでもつくれるよ」と言っていました。当時はネットでひろった画像をアイロンプリントしたキャラクターシャツでお茶を濁していました。画像生成AIによってこれが本当になりました。

 また、いろいろ試してみようと思います。


ブルーレイドライブとブルートゥース5.3アダプタ

 PCの機能アップも着々と進んでいます。

 🔗パソコン工房の LEVEL-R779-LC137KF-UL2X は、無線機能・光学ドライブがついていないので、周辺機器をつなぎました。



※ ハダノが4年前から愛用しているBDR-XD07J-UHDの後継機種です。
据え置き型ブルーレイレコーダーが読み取れないディスクでも再生でき、さすがパイオニア製と感心します。
PowerDVDでブルーレイ再生もバッチリです。


※ ワイヤレスイヤフォンやワイヤレスマウスなどを使うためには、Bluetoothアダプターが必要です。
この製品はノートPC内蔵型Bluetoothアダプターに比べ、接続が安定しています。


←前へ 見せてもらおうか、生成AI用PCの性能とやらを―2

次へ→ 見せてもらおうか、生成AI用PCの性能とやらを―4


教育DXブログの著者: ハダノ
ハダノ顔 Q大理学部生物学科数理生物学研究室にて分子進化学権威の宮田隆氏のもとFORTRANでDNA解析に没頭。F社のSEに内定していたが、科学のおもしろさを教えるため中学校理科教員を選択。
 新任のころから、「答えのない問題を追求させたい」「団結力と文化的な力を集団づくりで」「教育研究をもっと科学的に」「教育の情報化が必要」「チョーク&トークの注入式授業からアクティブラーニングへ」「教科横断的なSTEAM教育で生涯学習・SDGsへ」という思いを持ちつつ、4市10校にて勤務。
 9年間の教頭時代、さまざまな不条理・矛盾に悩み、ICTによる働き方改革を推進。2021年3月定年退職。「特定の学校だけでなく、広く人材育成を」「日本陥没をDXで食い止めたい」「元教員の自分にできることを」と、教育DX研究の道へ。
 おおいたAIテクノロジーセンター会員。デジタル人材育成学会・日本STEM教育学会・日本情報教育学会・データサイエンティスト協会・日本RPA協会の会員。JDLA G検定 2022 #1 合格者。
プライバシーポリシー  |  Copyright © 2022 HADANO