ハダノ元教頭が GIGAスクール と DX人材育成 について考えるブログ

見せてもらおうか、生成AI用PCの性能とやらを―1
イノベーションAI先端技術CGDX推進

見せてもらおうか、生成AI用PCの性能とやらを―1

🕓 9/26/2023 ↻ 10/9/2023

 AIが高速で進化する中、今までできなかったことができるようになりました。文章生成AIや画像生成AIは、革命的なテクノロジーです。

 「生成AIをちょっとさわってみたけど、実用的じゃない」と言う人たちは、部活動でいうと見学・体験入部で見切りをつけています。道具を揃えノックを受け続けて、だんだん楽しめるようになってきます。


 今回お届けするのは……

新しいPCで画像生成AIをローカル実行しまくってみた


 これまでの記事の中でも、何度か画像生成AIをとりあげてきました。アプリやサービスサイトなど無料で行う方法もありますが、いろんな制約があるためお試し程度で終わりがちです。

 やはり、ローカル実行(PC内でAIのプログラムを動かす)したいものです。

 まずは、文章生成AIに相談してみましょう。


画像生成AIローカル実行に関するChatGPTの回答は?


ハダノ
画像生成AIをローカル実行する利点は?

ChatGPT
画像生成AIをローカルで実行する利点はいくつかあります:

  1. プライバシー: ローカルでAIを実行すると、ユーザーのデータがインターネットを介して送信されることはありません。これにより、ユーザーのプライバシーが保護されます。
  2. レイテンシ: ローカルでAIを実行すると、ネットワーク遅延がなくなり、結果がすぐに得られます。これは、リアルタイムのアプリケーションや大量のデータを処理する必要がある場合に特に有用です。
  3. コスト: クラウドベースのAIサービスは、使用したリソースに応じて課金されます。一方、ローカルでAIを実行すると、初期のハードウェア投資以外に追加のコストは発生しません。
  4. 制御: ローカルでAIを実行すると、ユーザーは完全な制御を持つことができます。これにより、特定のハードウェア要件を満たすためにAIをカスタマイズしたり、特定のタスクに最適化したりすることが可能です。

ただし、これらの利点は一部のユーザーにとっては欠点となる場合もあります。例えば、高性能なハードウェアを購入する初期コストは高くなる場合があります。また、AIのセットアップとメンテナンスには専門知識が必要です。したがって、各ユーザーは自身のニーズと能力に基づいて最適な選択を行うべきです。


 要するに、

  • 「道具をレンタルすると料金がかかるし自由に使えない」(クラウドサービス)
  • 「自前の道具なら初期投資だけで好きなように使える」(ローカル実行)

ということです。

 さっそく生成AI用の最新PCを購入し(→ 🔗詳細は別の機会に)、Stable Diffusion をローカル実行することにしました。


生成AIグラビアに挑戦

 🔗生成AIグラビアをグラビアカメラマンが作るとどうなる?第七回:自分で始める環境作りとお薦め機材 / AUTOMATIC1111を動かしてみる (西川和久)

……を参考に、リアルアジア系モデルの 🔗yayoi_mix でビーチグラビアを生成してみました。

yayoi_mixでビーチグラビア

 標準モデルのかわりに好きなモデルを入れて生成できるのは、ローカル実行の強み(その1)です。

 この記事のトップ画像は、「日本人風の美少女ではトップクラスのクオリティ」と評判のモデル 🔗BlazingRealDrive で生成したものです。

 モデルによって生成画像の傾向に違いがあります。次々と新しいモデルが開発されているので、楽しみがつきません。


拡張機能でグラビア動画を生成

 「AIに動画生成はまだできない」「AIで動画生成できてもかなり手間がかかる」とハダノは思っていました。

 ところが、AnimateDiff を使えば1枚の画像から一貫性のある動画を生成できるというのです。この技術のすごいところは、今までと違い元の絵の状態を保ったまま生成できるという点です。

 Stable Diffusion Web UI の拡張機能 として組み込めば、テキストから動画を生成できます。いろんな拡張機能を入れられるのは、ローカル実行の強み(その2)です。

 🔗Stable Diffusionで動画生成AnimateDiff - 禁断のAI

……を参考に、動画生成してみました。


 まず 🔗yayoi_mix 、次に 🔗BlazingRealDrive で生成しました。

yayoi_mixでビーチグラビア動画 BlazingRealDriveでビーチグラビア動画

 Stable Diffusion の Seed値 を -1 にすると、毎回ランダムな値が作られ、違う画像が生成されます。気に入った画像が出るまで生成を繰り返すことを「ガチャを回す」ともいいます。何の制限もなくガチャを回せるのは、ローカル実行の強み(その3)です。

 ガチャを回してすぐ気づいたのは、「全身がはいると、顔が破綻しやすい」「上半身中心だと歩いているように見えない」ということです。

 今回は、Seed値 を 1483282210 に固定してモデルを変えてみました。構図・背景などは似た感じになりますが、モデルによってけっこう違いが出ました。yayoi_mix に比べると、BlazingRealDrive の方が濃い顔でしっかり歩くことが多いようです。語順・同義語などプロンプト(呪文)を微妙に変えると、結果も微妙に変わります。


 そうなると、他のモデルも試したくなります。

 🔗Dark Sushi Mix は、光と影の表現に優れる2次元イラスト系モデルです。

 「禁断のAI」の記事内で使われていたモデル BRAV5 の後継モデル 🔗BRAV6 も気になります。

 参考までに 🔗Dark Sushi Mix🔗BRAV6 で生成した動画を載せます(1/4サイズで)。

Dark Sushi Mixでビーチグラビア動画 BRAV6でビーチグラビア動画

 イラスト系モデルは背景が砂嵐になりがちですが、Dark Sushi Mix は、きれいにアニメ化してくれます。

 BRAV6 は、ソフトにボケた背景とさわやかな表情が魅力的ですが、動きに違和感があります。腕や脚が3本に見えるときがあります。


妖精コスプレグラビアを生成

 撮影機材・技術がなくても美しい浜辺や水着モデルを手配しなくても高品質なビーチグラビアを生成できました。

 本物そっくりなできばえで大満足ですが、せっかくの生成AIです。現実には存在しない画像も作ってみたくなります。

 「ビーチを歩いている妖精」を出そうとプロンプト(呪文)をいろいろ入れてみますが、妖精が妖怪に化けたりしてうまくいきません。学習に使われた画像からかけ離れたものは難しいようです。

 「妖精コスプレグラビアならありそう」と考え、プロンプトの服装指定を "white flower fairy style costume" にするとうまくいきました(Seed = 1483282210)。

yayoi_mixで妖精コスプレグラビア動画

 動画の場合、派手な衣装・動作だと「妖精のはね」がちぎれたりして崩壊しやすいので、プロンプトを細かく調整する必要がありました。


 同じ yayoi_mix で、ガチャを回して見栄えのする静止画を作ってみました。

yayoi_mixで妖精コスプレグラビア

 静止画なら、動画より自由な構図・衣装・ポーズを楽しめます。これからいろいろやっていきたいと思います。


【結論】画像生成AIをローカル実行すると、超楽しい!

 今回あらためて実感したローカル実行の利点は、、、

  • (その1)標準モデルのかわりに好きなモデルを入れて生成できる
  • (その2)いろんな拡張機能を入れられる
  • (その3)何の制限もなくガチャを回せる

ということです。


 たまにしか出かけないならタクシーやレンタカーでいいかもしれません。いつでもどこへでも行きたいならマイカーが便利です。好みのカーアクセサリーをつけたり、スタッドレスタイヤに交換したり、いつでもどこへでも気兼ねなく運転したりできるのがマイカーの強みです。特に、運転初心者が運転を楽しめるようになりたいなら、マイカーが必須でしょう。

 画像生成AIのローカル実行とは、マイカーの運転のようなものです。乗りこなせるようになると楽しくなります。



※ 画像生成AIの第一人者である深津貴之さん(→SFマガジンの表紙と絵本をAI生成)による解説書です。
画像生成AIの経緯・仕組み、使用・活用方法、法律・社会問題まで幅広く取り上げています。
ハダノはこの一冊で一通り学び、自分の画像生成に生かしています。


次へ→ 見せてもらおうか、生成AI用PCの性能とやらを―2


教育DXブログの著者: ハダノ
ハダノ顔 Q大理学部生物学科数理生物学研究室にて分子進化学権威の宮田隆氏のもとFORTRANでDNA解析に没頭。F社のSEに内定していたが、科学のおもしろさを教えるため中学校理科教員を選択。
 新任のころから、「答えのない問題を追求させたい」「団結力と文化的な力を集団づくりで」「教育研究をもっと科学的に」「教育の情報化が必要」「チョーク&トークの注入式授業からアクティブラーニングへ」「教科横断的なSTEAM教育で生涯学習・SDGsへ」という思いを持ちつつ、4市10校にて勤務。
 9年間の教頭時代、さまざまな不条理・矛盾に悩み、ICTによる働き方改革を推進。2021年3月定年退職。「特定の学校だけでなく、広く人材育成を」「日本陥没をDXで食い止めたい」「元教員の自分にできることを」と、教育DX研究の道へ。
 おおいたAIテクノロジーセンター会員。デジタル人材育成学会・日本STEM教育学会・日本情報教育学会・データサイエンティスト協会・日本RPA協会の会員。JDLA G検定 2022 #1 合格者。
プライバシーポリシー  |  Copyright © 2022 HADANO