home » news » 画像生成AIについて(Midjourney・Stable Diffusion・DALL・E2)

News

「お天気が悪かったら?」
「撮影日の変更は?」
「子供の体調が急に…」

臨機応変に対応致します。
まずはご相談ください!

emiphotoへのお問い合わせはこちら

2023年01月21日

画像生成AIについて(Midjourney・Stable Diffusion・DALL・E2)

Midjourney・Stable Diffusion・DALL・E2など昨年の夏ごろから次々と高性能なものがでて話題になった画像生成AIについて調べてみました。

画像生成AIとは

AIとは『人間のような知能を持ったコンピューター』で、画像生成AIは、指示した文章(画像)から画像を作り出します。
AIは過去に作りだされた絵、写真などを大量に学習し、新たに組み合わせることでアーティスティックな絵画、写真に近い写実的なもの、イラスト、アニメなど様々なタイプの画像を短期間で何パターンも作成します。

主な画像の生成方法

どんな絵を描いてほしいか指示する文章や元になる画像をAIに入力することで画像を生成します。
文章は日本語よりも英語の方が正確な結果がでます。

 

①文章で指示を出す方法
Photo of a girl という文章をAIに入力しています。
AIアートの生成方法
写真のような女性の画像が作成されました。

 
②文章+元になる画像で指示を出す方法
Photo of a girl という文章と、もとになる写真を入力しています。
AI画像作成方法
入力した写真の背景や構図などが反映されています。

AIによって描画される多様な作風

AIに渡す文章にXX風になど作風を指定する内容を含むことで、様々な画像にすることができます。

 
例)Cat painted by Van Gogh(ゴッホの描く猫)、Landscape painted by da Vinci(ダビンチの描く風景画)、conceptual art(コンセプトアート風に)、portrait photograph(ポートレート写真)など
StableDiffusion
※上記はStable Diffusionにて生成

簡単にAIの画像生成を試す方法

DALL・E2はは画像生成AIの一つで、インターネット上ですぐに試すことができます。
グーグルのアカウントなどでサインアップすることができ50回まで無料で画像を作成することができます。
■DALL・E2
https://openai.com/dall-e-2/

 
使い方動画

主な画像生成AI

簡単に使えてメジャーなMidjourney・Stable Diffusion・DALL・E2の利用面での違いを調べてみました。
画像生成AI
その他として、Google「Imagen」、Microsoftの「NUWA Infinity」などがあります。
商用利用の可否は、AIの学習元になっている画像の著作権の問題で今後変わっていく可能性があります。

Midjourney(ミッドジャーニー)

■サイト 
https://midjourney.com/


 
”Discord(ディスコード)”というフリーウェアのチャット上で/imagineと入力後に画像を指示する文章を入れることで画像を生成します。
各種パラメータで画像のサイズの指定や画像指示のキーワードの重みづけをするなど、細かな設定ができます。

 
利用画面
Midjourney利用例
作られた4パターンの画像
Midjourney利用例

Stable Diffusion(ステーブルディフュージョン)

■サイト
https://ja.stability.ai/blog/stable-diffusion-public-release


 
オープンソースとして技術が一般公開されています。
Dream Studiomageなど一部有料でWebサービスとして提供されているものと、Artroomなどインストールすることで使うものがあります。
(またオープンソースなのでこのプログラム自体の改変・利用もすることもできます)

 
以下の例はArtroomをインストールした場合の例です。
何枚でも無料でつくることができます。
■Artroomインストーラ
https://github.com/artmamedov/artroom-stable-diffusion
※アプリインストールには20GB程必要になります。ご注意ください。
Stable Diffusion利用イメージ
作りたいイメージと避けたいイメージも文章で入力することができます。

 
作られた4パターンの画像
Stable Diffusion
一度に作る画像の数は指定することができます。

DALL・E2(ダリ)

■サイト 
https://openai.com/dall-e-2/


 
CGアニメのキャラWALL-Eと画家のダリが名前の由来になっています。
生成された画像にはAIが作成したと分かる五色のマークがつきます。

 
利用画面
DALL・E2画面

 
作られた4パターンの画像
DALL・E2
右下にのマークがついています

 
その他の機能として元のキャンバスを拡大して周りを作成することができます。
例えば、以下はモナリザで、背景に海や山の景色を拡張するようにテキストをいれた例です。
DALL
DALL
こちらの動画で絵画拡大のすごさが伝わります。

AI画像生成の苦手な点

①写実の正確な描画
一瞬で独創的な絵画を作ることができる一方、写実的な人や動物の全身が出されないことが多くあります。

 
風景との溶け込み、足が多い、手の指の数が違うなど
画像生成AI

 
②テキストでイメージを伝える難しさ
また、「川に泳ぐサケ」とAIに指示をすると川にサケの切り身が泳いでいたり、思った通りのものが一回で出来るとは限らず、基本的に何度も指示のテキストを修正してイメージを近づけていくという作業が必要になります。

企業での画像生成AIの活用

画像生成AIは企業のデザインの分野でに活用が始まっています。

 
①車のデザインへの活用
AIによってデザインされた架空のサーキットをボディーの模様として採用したアート車「Alpine A110 Sastruga」(A110サストルガ)が作られています。
また日産などの大手自動車メーカーでもーデザインへのAI導入に向かい調整しているそうです。

 
②パッケージデザイン
デザイン生成と評価を繰り返し行い1時間で1,000のデザイン案を生み出すサービス「パッケージデザインAI」を利用して食品や化粧品のパッケージがデザインされています。
このパッケージデザインAIはカルビーやオタフクソースのデザイン変更に導入されていて、変更によって売り上げを伸ばしているそうです。

画像生成AIの問題点と展望

AIによって今までのイラストレーターの仕事が奪われてしまうという意見、
またStable DiffusionやMidjourneyについては、学習元である何億もの画像の利用許可をすべてとっていないのは著作権違反になるのでは?といった声があがっています。

 
一方で人とAIによってこれまでに無いより素晴らしいものができるのでは?という意見もあります。

 
願わくば、人とAIが協力することでより斬新でわくわくするものが作られていってほしいです。