2023年01月21日
画像生成AIについて(Midjourney・Stable Diffusion・DALL・E2)
Midjourney・Stable Diffusion・DALL・E2など昨年の夏ごろから次々と高性能なものがでて話題になった画像生成AIについて調べてみました。
AIとは『人間のような知能を持ったコンピューター』で、画像生成AIは、指示した文章(画像)から画像を作り出します。
AIは過去に作りだされた絵、写真などを大量に学習し、新たに組み合わせることでアーティスティックな絵画、写真に近い写実的なもの、イラスト、アニメなど様々なタイプの画像を短期間で何パターンも作成します。
どんな絵を描いてほしいか指示する文章や元になる画像をAIに入力することで画像を生成します。
文章は日本語よりも英語の方が正確な結果がでます。
①文章で指示を出す方法
Photo of a girl という文章をAIに入力しています。
写真のような女性の画像が作成されました。
②文章+元になる画像で指示を出す方法
Photo of a girl という文章と、もとになる写真を入力しています。
入力した写真の背景や構図などが反映されています。
AIに渡す文章にXX風になど作風を指定する内容を含むことで、様々な画像にすることができます。
例)Cat painted by Van Gogh(ゴッホの描く猫)、Landscape painted by da Vinci(ダビンチの描く風景画)、conceptual art(コンセプトアート風に)、portrait photograph(ポートレート写真)など
※上記はStable Diffusionにて生成
DALL・E2はは画像生成AIの一つで、インターネット上ですぐに試すことができます。
グーグルのアカウントなどでサインアップすることができ50回まで無料で画像を作成することができます。
■DALL・E2
https://openai.com/dall-e-2/
使い方動画
簡単に使えてメジャーなMidjourney・Stable Diffusion・DALL・E2の利用面での違いを調べてみました。
その他として、Google「Imagen」、Microsoftの「NUWA Infinity」などがあります。
商用利用の可否は、AIの学習元になっている画像の著作権の問題で今後変わっていく可能性があります。
■サイト
https://midjourney.com/
”Discord(ディスコード)”というフリーウェアのチャット上で/imagineと入力後に画像を指示する文章を入れることで画像を生成します。
各種パラメータで画像のサイズの指定や画像指示のキーワードの重みづけをするなど、細かな設定ができます。
利用画面
作られた4パターンの画像
■サイト
https://ja.stability.ai/blog/stable-diffusion-public-release
オープンソースとして技術が一般公開されています。
Dream Studioやmageなど一部有料でWebサービスとして提供されているものと、Artroomなどインストールすることで使うものがあります。
(またオープンソースなのでこのプログラム自体の改変・利用もすることもできます)
以下の例はArtroomをインストールした場合の例です。
何枚でも無料でつくることができます。
■Artroomインストーラ
https://github.com/artmamedov/artroom-stable-diffusion
※アプリインストールには20GB程必要になります。ご注意ください。
作りたいイメージと避けたいイメージも文章で入力することができます。
作られた4パターンの画像
一度に作る画像の数は指定することができます。
■サイト
https://openai.com/dall-e-2/
CGアニメのキャラWALL-Eと画家のダリが名前の由来になっています。
生成された画像にはAIが作成したと分かる五色のマークがつきます。
利用画面
作られた4パターンの画像
右下にのマークがついています
その他の機能として元のキャンバスを拡大して周りを作成することができます。
例えば、以下はモナリザで、背景に海や山の景色を拡張するようにテキストをいれた例です。
こちらの動画で絵画拡大のすごさが伝わります。
①写実の正確な描画
一瞬で独創的な絵画を作ることができる一方、写実的な人や動物の全身が出されないことが多くあります。
風景との溶け込み、足が多い、手の指の数が違うなど
②テキストでイメージを伝える難しさ
また、「川に泳ぐサケ」とAIに指示をすると川にサケの切り身が泳いでいたり、思った通りのものが一回で出来るとは限らず、基本的に何度も指示のテキストを修正してイメージを近づけていくという作業が必要になります。
画像生成AIは企業のデザインの分野でに活用が始まっています。
①車のデザインへの活用
AIによってデザインされた架空のサーキットをボディーの模様として採用したアート車「Alpine A110 Sastruga」(A110サストルガ)が作られています。
また日産などの大手自動車メーカーでもーデザインへのAI導入に向かい調整しているそうです。
②パッケージデザイン
デザイン生成と評価を繰り返し行い1時間で1,000のデザイン案を生み出すサービス「パッケージデザインAI」を利用して食品や化粧品のパッケージがデザインされています。
このパッケージデザインAIはカルビーやオタフクソースのデザイン変更に導入されていて、変更によって売り上げを伸ばしているそうです。
AIによって今までのイラストレーターの仕事が奪われてしまうという意見、
またStable DiffusionやMidjourneyについては、学習元である何億もの画像の利用許可をすべてとっていないのは著作権違反になるのでは?といった声があがっています。
一方で人とAIによってこれまでに無いより素晴らしいものができるのでは?という意見もあります。
願わくば、人とAIが協力することでより斬新でわくわくするものが作られていってほしいです。