ハダノ元教頭が GIGAスクールと DX人材育成について考えるブログ

見せてもらおうか、生成AI用PCの性能とやらを―3

🕓 10/16/2023 ↻ 11/3/2023

　AIが高速で進化する中、今までできなかったことができるようになりました。文章生成AIや画像生成AIは、革命的なテクノロジーです。

　「生成AIをちょっとさわってみたけど、実用的じゃない」と言う人たちは、部活動でいうと見学・体験入部で見切りをつけています。道具を揃えノックを受け続けて、だんだん楽しめるようになってきます。

　今回お届けするのは……

Stable Diffusionの拡張機能で推しのグラビア生成に挑戦してみた

　第1回の記事で述べた画像生成AIをローカル実行する利点

（その2）いろんな拡張機能を入れられる

を深掘りしてみます。

　人気の拡張機能を調べ、優先度の高いものから試してみることにしました。 → 🔗【Stable Diffusion】WebUIに必ず導入したいおすすめの拡張機能40選+α【Extensions】

現在有効化している拡張機能を色分けして見やすく

🔗【Enable Checker】拡張機能の有効化・無効化状態を色分けして教えてくれる拡張機能の紹介！【Stable Diffusion】

に従って、Enable Checker をインストールしました。

　ついでに、

🔗【Stable Diffusion】よく使う機能を簡単に切り替えられるQuicksettings list

で、設定メニューの深い階層にもぐらなくても ”VAE”と”Clip skip” を変更できるようにしました。

　これで、Stable Diffusionの操作がしやすくなりました。

簡単な単語から類推して自動でプロンプトを

🔗【Stable Diffusion】拡張機能「text2prompt」を使って、簡単な1単語から複数のプロンプトを生成してもらおう！

に従って、text2prompt をインストールしました。

Text2Prompt タブに切り替える。
Input Theme 欄に出したいイメージの英単語を入れる。Google翻訳Chrome拡張などで翻訳すると便利。
Input Negative Theme 欄に出したくないイメージの英単語を入れる。
Generate ボタンをクリック。クリックするたびに違うプロンプトが Output 欄に出力される。
Send to txt2img ボタンをクリックで txt2img タブに切り替わり、プロンプト欄に送られる。

＜作例1 ＞

head biting, rape face, halloween, date pun, pumpkin costume, evil smile, naked pumpkin, full-face blush, surprise kiss, pumpkin, gothic, pumpkin mask, dia de muertos, upside-down kiss, straw doll, purple nightgown, werewolf, halloween costume, wolf mask, brown lips

＜作例2 ＞

trick or treat, ghost costume, pumpkin mask, wolf mask, naked pumpkin, surprise kiss, pumpkin costume, happy halloween, oni, clown mask, brown lips, easter, missing tooth, ii fuufu no hi, date pun, jack-o'-lantern, full-face blush, demon parade, pumpkin, halloween costume

「ハロウィンの夜」作例1 と作例2 の生成画像

　ちょっとおどろおどろしい感じです。

EasyNegative, (worst quality, low quality: 2.0), normal quality, ugly face, unclear eyes, bad mouth, bad anatomy, extra legs, bad anatomy

　というネガティブプロンプトを入れ、きれいめの「ハロウィンの夜」を生成してみました。

　同じモデル（yayoi_mix）なのに、けっこう雰囲気が変わります。

　注意点として、

Text2Prompt タブの Generate ボタンは、(通常の)プロンプトをランダム生成するもの。ネガティブプロンプトは生成しない。
txt2img タブの Generate ボタンは、画像をランダム生成するもの。

ということを知っておく必要があります。

　プロンプトのランダム生成 × 画像のランダム生成の組み合わせで、かなりのバリエーションが生まれます。ネガティブプロンプト・解像度・モデルによってさらにバリエーションが豊かになります。

既存のモデルに新たな画像を追加学習させた LoRA のファイルを自作

　バリエーション豊かな画像が生成されるのはよいことですが、「キャラクターに一貫性を持たせる」のは難しくなります。

　自分の思い通りの画像を作りたいときに助けとなるのが、LoRA です。→ 🔗思い通りの画像を LoRA を使って生成する方法【18選】

　既存のモデルに新たな画像を追加学習させた LoRA のファイルを自作できれば、特定の人物を主人公にできます。

🔗【Stable Diffusion】超簡単にLoRAを自作できる拡張機能「sd-webui-train-tools」の使い方！

に従って、sd-webui-train-tools をインストールしました。

　新たに作られた Train Tools タブに切り換えました。

　ハダノが個人的に最も推している（最推し）、アマチュア鍵盤奏者kemi の写真を12枚用意しました。ふだんよく使うモデルのyayoi_mix をベースに12枚の写真を追加学習させました。

　エラーが出やすいと言われる sd-webui-train-tools ですが、Begin train ボタンをクリックして待つこと20分、、、無事に LoRA のファイルができあがりました。Use xformers のチェックをはずしておいたのがよかったようです。

outputs\train_tools\projects\kemi\versions\v1\trains\yayoiMix_v20-bs-1-ep-20-op-Lion-lr-0_0001-net-128-ap-64 フォルダの中の

kemi-v1.safetensors を

models\Lora フォルダへコピーしておきます。

自作LoRA を顔だけに適用

　いよいよ、自作LoRAを使って最推しのコスプレグラビアを作ります。顔だけ適用できれば十分なので、

🔗”After Detailer”を使って顔だけにLoRAを適用する方法

に従って、拡張機能 After Detailer をインストールしました。

　Enable ADetailer のチェックを入れ、model に mediapipe_face_full を指定しました。

　ADetailer prompt 欄に <lora:kemi-v1:1> を入力して、Generate ボタンをクリックしますが、サイケデリックな顔になってしまって失敗です。

　気を取り直して、ADetailer negative prompt 欄に ugly を入力し、LoRAの重みを <lora:kemi-v1:0.7> で7割にすると、いい感じになりました。

自動でガチャを

　コスプレの出来ばえにプラスして、推しのイメージに合うかどうかもチェックしたい場合、どうしてもガチャの回数が増えます。なんとか自動でガチャを回し続ける方法はないかと考えていたら、ピッタリの拡張機能がありました。

🔗【Generate forever】無限に画像を生成できるようになる便利機能の紹介！【Stable Diffusion WebUI】

に従って、拡張機能 Generate forever をインストールしました。

Generate foreverで無限に画像生成ガチャ

　Generate ボタンの下に追加された Generate Forever ボタンと Cancel Forever ボタンによって、自動でガチャを回す／止めるが簡単にできるようになりました。

　ガチャは、何が出るかわからないワクワクがあります。無料で無限にガチャを回せる Generate forever は最高です。

　「ビーチを飛んでいる妖精」のガチャを回し続けて、イメージにぴったりの一枚を選びました。

＜ LoRA適用前＞

＜ LoRA適用後＞

えー……？　これがわたしですか？
……確かに元の画像と比べると、別人ですね。この美しい天使の顔の7割がわたしなんですね。

天使じゃなくて、妖精ですね。
顔だけをよく見ると、左の口角を上げるクセや各パーツの特徴がよく再現されていると思いますよ。

【結論】Stable Diffusionの拡張機能で、尊い推しのグラビアが生成できる

　オタクの夢、ついに実現です。

　画像生成AIをローカル実行する利点（その2）いろんな拡張機能を入れられる　を生かそうと、5つの拡張機能をインストールしてみました。

　特に、sd-webui-train-tools は、超簡単にLoRAを自作できる夢のような拡張機能でした。追加学習がエラーなく短時間で実行できたのは、PCの性能のおかげです。推しの画像データを外部に流出させることなく安全にLoRAファイルを作れたのは、ローカル実行ならではです。

　長男は幼稚園のとき、「パパはコンピュータでなんでもつくれるよ」と言っていました。当時はネットでひろった画像をアイロンプリントしたキャラクターシャツでお茶を濁していました。画像生成AIによってこれが本当になりました。

　また、いろいろ試してみようと思います。

　PCの機能アップも着々と進んでいます。

　🔗パソコン工房の LEVEL-R779-LC137KF-UL2X は、無線機能・光学ドライブがついていないので、周辺機器をつなぎました。

PIONEER ポータブルブルーレイドライブ BDR-XD08BK

※ ハダノが4年前から愛用しているBDR-XD07J-UHDの後継機種です。
据え置き型ブルーレイレコーダーが読み取れないディスクでも再生でき、さすがパイオニア製と感心します。
PowerDVDでブルーレイ再生もバッチリです。

楽天

Amazon

Yahoo!

UGREEN PC用長距離Bluetooth 5.3アダプター 100M伝送

※ ワイヤレスイヤフォンやワイヤレスマウスなどを使うためには、Bluetoothアダプターが必要です。
この製品はノートPC内蔵型Bluetoothアダプターに比べ、接続が安定しています。

Amazon

Yahoo!

←前へ　見せてもらおうか、生成AI用PCの性能とやらを―2

次へ→　見せてもらおうか、生成AI用PCの性能とやらを―4

教育DXブログの著者：ハダノ

Q大理学部生物学科数理生物学研究室にて分子進化学権威の宮田隆氏のもとFORTRANでDNA解析に没頭。F社のSEに内定していたが、科学のおもしろさを教えるため中学校理科教員を選択。
新任のころから、「答えのない問題を追求させたい」「団結力と文化的な力を集団づくりで」「教育研究をもっと科学的に」「教育の情報化が必要」「チョーク＆トークの注入式授業からアクティブラーニングへ」「教科横断的なSTEAM教育で生涯学習・SDGsへ」という思いを持ちつつ、4市10校にて勤務。
9年間の教頭時代、さまざまな不条理・矛盾に悩み、ICTによる働き方改革を推進。2021年3月定年退職。「特定の学校だけでなく、広く人材育成を」「日本陥没をDXで食い止めたい」「元教員の自分にできることを」と、教育DX研究の道へ。
おおいたAIテクノロジーセンター会員。デジタル人材育成学会・日本STEM教育学会・日本情報教育学会・データサイエンティスト協会・日本RPA協会の会員。JDLA G検定 2022 #1 合格者。

→ 📨 お問い合わせはこちら