現代では画像生成にもAIが用いられており、誰でも簡単に高品質な絵が作れるようになりました。
画像生成AIを活用する方も増えてきた中で「Japanese Stable Diffusion」というものの存在を知り、興味をもっている方も多いと思います。
今回の記事ではJapanese Stable Diffusionの概要やメリットを、活用事例を含めてわかりやすくご紹介します。また使い方やポイント、注意点も解説しますので、本記事を読むだけでJapanese Stable Diffusionを理解できるようになるでしょう。
Japanese Stable Diffusionの概要
Stable Diffusionは、オープンソースで公開されている画像生成AI技術のことです。
イギリスのAI開発企業「Stability AI」が運営・提供を行っています。
この画像生成AI技術の日本語に特化したモデルが「Japanese Stable Diffusion」です。
希望の画像に該当するテキストを入力するだけで高品質な画像を瞬時に作成してくれるため、クリエイティブ業におけるアイデア出しやフレームワークの代わりとして役立てられています。
Japanese Stable Diffusionの概要を一覧にすると、以下のようになります。
サービス名称 | Japanese Stable Diffusion |
運営会社 | Stability AI(イギリス) |
できること |
|
使用環境 |
|
商用利用および配布 | 可能 |
使用アルゴリズム | 深層拡散モデル |
料金 | 【ローカル版】
【ブラウザ版】
|
そもそもの「画像生成AI」自体の概要についてより詳しく理解したい方は、以下の記事が参考になります。
Japanese Stable Diffusion XLとは?
日本語に特化した画像生成モデルであるJapanese Stable Diffusionに「XL」を加えたこちらは、2023年にリリースされた新バージョンのことを指します。
他の画像生成AIモデルと比較してもプロンプト読み込みの正確性や画像の品質、使い勝手などが圧倒的に向上しているため「正確性が高くて使いやすい」といった評判があります。
japanese Stable diffusionの料金
Japanese Stable Diffusionは基本的にローカル版とブラウザ版どちらも無料で使えますが、ブラウザ版は有料のものを使うことで機能や枚数の制限がなくなり、より自由度の高い使い方が可能になります。
前述の一覧表にもありますが、Japanese Stable Diffusionをブラウザ版で使う場合に必要な金額は以下のとおりです。
Japanese Stable Diffusion ブラウザ版 | 料金 |
Stable Diffusion XL | 月々1365円 |
Dream Studio | 10ドル(約1500円) |
Mage.space | 15ドル(約2200円) |
clipdrop | 月々1971円 |
Hugging Face | 9ドル(約1300円) |
一方ローカル版で使う場合、もとから機能や枚数の制限などなく完全な形で活用可能です。
しかし大容量ファイルのダウンロードやインストールが必要になること、また実際に使用する際も高負荷な処理が必要になることから、ハイスペックなパソコンでないと快適に動かせないのが現状です。
Japanese Stable Diffusionのメリット・特徴
ここではJapanese Stable Diffusionのメリットおよび特徴として、以下の4つをご紹介します。
- プロンプトで画像のニュアンスを細かく変えられる
- 商用利用が可能
- 日本語入力にも対応
- ブラウザ版とローカル版両方で使える
1.プロンプトで画像のニュアンスを細かく変えられる
作成する画像のニュアンスを細かく変えられるのは、Japanese Stable Diffusionの大きなメリットです。
例えば希望の画像テーマが「静かな雰囲気の夕暮れの森」だった場合、画像のニュアンスが「アニメーション調」なのか「絵画調」なのか、また「実写調」かで印象は大きく変わります。
その旨をプロンプトとして記述すれば、その命令に合わせたニュアンスの絵を作ってくれるということです。
またスタイルや雰囲気、明るさや表情も数値で調整できるため、ニーズや好みに合った画像も再現可能です。とはいえ、もちろん人間のイラストレーターと比較してしまえば精度は劣りますが、今後の未来のイラストレーターを脅かす存在でもあります。
2.商用利用が可能
Japanese Stable Diffusionは商用利用が可能です。
公式で以下のように公表しているためです。
- 生成された画像については、一切権利を主張しない
- 個人情報や誤情報の拡散など、人に危害を与えるケース以外なら自由に利用可能
商用利用可能ということは商品やサービスの宣伝、マーケティング、開発などビジネスに大いに活かせるということ。生産性向上はもちろん、新しいアイデアの思考などに活用できる点はメリットといえるでしょう。
3.日本語入力にも対応
Japanese Stable Diffusion XLは日本語でのプロンプト入力に対応しています。
日本語特有の難しい表現を認識し、広範囲な文化やアート、伝統的なものから現代的なものまでを幅広く表現できるようになりました。
プログラミングの知識や英語のプロンプトを覚える必要がなく、より自然な言語で対話する感覚で活用できることは、英語が苦手な日本人にとって大きなメリットになるでしょう。
4.ブラウザ版とローカル版両方で使える
Japanese Stable Diffusionは、ブラウザ版とローカル版の両方で使用できます。
ブラウザ版であればソフトウェアのインストールなど不要で気軽にアクセス可能です。
一方のローカル版は、ユーザーのコンピュータにダウンロードして使用するため、オフラインでも使用できることとデータのプライバシー保護に優れていることがメリットです。
Japanese Stable Diffusionのデメリット・注意点
Japanese Stable Diffusionにはメリットもある一方、デメリットもあります。
ここでは、以下の2つをご紹介します。
- 使いこなすまでに時間がかかる
- 自動生成された画像が著作権に触れる可能性もゼロではない
1.使いこなすまでに時間がかかる
一定の時間と努力が必要な点はデメリットになるでしょう。
使うサービスによってセットアップの方法やモデルの挙動、出力の制御方法やプロンプトの適切な書き方も異なるためです。
とはいえ慣れることで難なく利用できるようになるため、継続的な学習と実践は欠かせません。
2.自動生成された画像が著作権に触れる可能性もゼロではない
Japanese Stable Diffusionは商用利用が可能ですが「著作権侵害のリスクはゼロ」というわけではありません。元の画像を参考にして新しい絵を作り出すロジックだからです。
例えば大手ブランドロゴのパロディや著名人の偽造画像など、著作権侵害に該当するようなものが生成される可能性もあります。そのような画像を商用利用することで、損害賠償になるリスクもあるのです。
完全に信用し切るのではなく、自分自身の手で画像検索などしてチェックするなど、リスクを避ける姿勢が大切になります。
Japanese Stable Diffusionの使い方
使い方については、上記の動画が参考になるのでぜひ参考にしてください。
大まかなセットアップ手順は、以下のようになります。
- Colaboratoryをインストール
- Hugging Faceアカウントの作成
- アクセス情報の共有にチェックを入れ、Accwss repositoryをクリック
- Japanese Stable Diffusionのページから、「pip install git~~」のコードをコピー
- Colaboratoryのコードボックスに「!」をつけた後コードを貼り付け
- Japanese Stable Diffusionのインストール完了
- Colaboratoryに「!huggingFace-cli login」を入力して実行
- URLが表示されたらアクセスし、任意のトークン名を入力
- 発行されたトークンをコピーし、Colaboratoryに貼り付け
- 画像生成コードをJapanese Stable Diffusionのページからコピーし、Colaboratoryに貼り付け
- コード内「save(“output.png”)」を削除
Japanese Stable Diffusionが活用されているサービス
Japanese Stable Diffusionはオープンソースの画像生成モデルなので、活用している企業は多岐にわたります。ここでは、以下の3つをご紹介します。
- Stable Doodle
- Reimagine XL
- rinna
Japanese Stable Diffusionが活用されているサービス1.Stable Doodle
こちらはStable Diffusionの運営会社「Stability AI」が運営する画像生成サービスで、ラフなスケッチにプロンプトを加えることで高度な画像に変換してくれます。
このシステムにはStable Diffusion高度な画像生成技術と「T2I-Adapter」というコンディションコントロールシステムが用いられています。
ログイン不要で使えるなど、その手軽さも魅力のひとつです。
Japanese Stable Diffusionが活用されているサービス2.Reimagine XL
引用:Reimagine XL
こちらもStability AI社が運営する画像生成サービスで、参考画像をアップロードするだけで「似た画像」をはじめさまざまな案を提示してくれます。
アルゴリズムはStable Diffusionのものと同様です。
シンプルで使い勝手に優れたUI、そして前述のStable Doodle同様ログインなしで誰でも気軽に使用できる点がポイントです。
Japanese Stable Diffusionが活用されているサービス3.rinna
引用:rinna
「女子高生AIりんな」で有名な日本のAIソフトウェア企業「rinna」は2022年9月、Stable Diffusionに日本語キャプション画像による追加学習機能を備えた日本語特化の画像生成モデル「Japanese Stable Diffusion」を開発。
また独自のサービス「キャラる」およびSNSにも本モデルを採用することで、誰でも「Japanese Stable Diffusion」での画像生成体験ができるようになっています。
Japanese Stable Diffusionで画像生成する際のポイント
Japanese Stable Diffusionを用いて画像生成を行うなら、以下のポイントが重要になります。
- プロンプトでは優先したい要素を先に記述する
- ネガティブプロンプトを活用する
- 「img2img」の画像アップロード機能を活用する
それぞれ見ていきましょう。
プロンプトでは優先したい要素を先に記述する
プロンプトの記述においては、なるべく優先したい要素を先に記述しましょう。
Stable Diffusionは基本的に、プロンプトの入力順に実装を行うとされているためです。
まずは画像のテーマ、テイスト、人物の性別や年齢などの大部分を指定して固めること。
その後で髪型や服装、表情といった細かな要素を、追加・調整する形で記述しましょう。
ネガティブプロンプトを活用する
ネガティブプロンプトとは「除外したい要素」のことです。
例えばネガティブプロンプトとして「車」や「機械」を指定すると、それらの要素は画像に含まれなくなります。
またピンボケ防止やテイスト除外のプロンプトも数多く存在しており、これらはイメージどおりの画像を生成させるうえで非常に有効な手段になるので、積極的に活用してみましょう。
「img2img」の画像アップロード機能を活用する
プロンプトとしての言語化が難しい画像の場合は、「img2img」などの画像アップロード機能を活用しましょう。適切なプロンプトを考える手間が省けるうえ、AI側としても理想に近いイメージを認識するのが困難だからです。
参考となる画像をアップロードすることで、AIもそれに近いイメージの作成がしやすくなります。
Japanese Stable Diffusionとは?まとめ
Japanese Stable Diffusionはプロンプトの指定によって、アニメ調や実写帳など細かなニュアンスを変えられる高性能なAIです。商用利用や配布も可能となっているため、個人で楽しむだけでなくビジネスにも幅広く活用していけることは間違いありません。
日本語に対応していたりブラウザで使えたりと機能性に優れています。
その点デメリットもゼロではなく、Pythonプログラミングの知見が必要になることから一定の慣れが必要です。
Japanese Stable Diffusionはすでに国内のサービスで活用されている事例もあります。
ぜひプロンプトの書き方やアップロード機能などを積極的に活用しながら、存分にビジネスに役立ててください。