俄然注目を集めている画像生成AIサービスMidjourney(ミッドジャーニー)ですが、思ったように画像を生成させるための、プロンプト(指示文)への効果的なテキスト入力方法がSNSなどで公開されています。
基本構文は下記のように、プロンプトの後にテキスト入力します。
<方向性>,<主題 – 1>,<主題 – 2>,…,<作者名など補足情報>,<パラメーター設定>
上掲のタイトル画像作成のためのプロンプトには、まず”a ukiyoe of Human Digital Consultants, –ar 2:1″と入力しました。
どういうアルゴリズムか不明ですが、Human Digitalが赤い丸、Consultantsが複数の人物を呼び出しているのでしょうか。
その後、浮世絵(ukiyoe)にもいろんな作家がいるので、北斎(Hokusai)を追記し画像生成すると、一人の着物の女性と富士山と波が現れました。
ただし名前が知られていないマイナーな作家を入力しても、Midjourney AIのデータベースに無ければ反映されないようです。
Midjourney Botへ下記のようにテキストプロンプトで指示すれば、浮世絵以外にも油絵や水彩画、イラストや漫画、または写真風にも生成させることができます。
a ukiyoe of | 浮世絵風に画像生成する。 |
a detailed oil painting of | 重厚で精緻な油絵風に画像生成する。 |
a detailed water painting of | 軽いタッチの水彩画風に画像生成する。 |
a illustration of | 手描きイラストレーション風に画像生成する。 |
a cartoon of | ユーモラスな漫画風に画像生成する。 |
a portrait of | 肖像画風に顔つきで画像生成する。 |
a photo of | モノクロ写真のような表現に画像生成する。 |
V1〜4ボタンを使った場合、前回の生成画像を元にバリエーション画像を4点作成します。
事前に方向性が決まっているのであれば、画像のURLを最初にイメージプロンプトとして指定すると近道となるかもしれません。
<画像URL>,<方向性>,<主題 – 1>,…,<作者名など補足情報>,<パラメーター設定>
プロンプトに同じテキストを入れても、Midjourney Botはその都度違うバリエーションの画像を生成します。
以下によく使うパラメーター(変数)設定を列記します。
パラメータ | 説明 |
−−iw | サンプル画像のURLを使った場合、テキストに対する画像の比重を設定します。デフォルトは0.25です。 |
−−iw | サンプル画像のURLを使った場合、テキストに対する画像の比重を設定します。デフォルトは0.25です。 |
−−no | –no 否定的なプロンプトを設定します。(例:–no plants は植物を除去します) |
–w | 画像の幅サイズの指定。64の倍数で指定します。 |
–h | 画像の高さサイズの指定。64の倍数で指定します。 |
–hd | より大きな画像に適した別のアルゴリズムを使用しますが、構図の一貫性が失われます。 |
–wallpaper | 壁紙サイズの幅1920ピクセル、高さ1024ピクセルで生成します。。 |
−−aspect −−ar |
16:9(ワイドスクリーン)や1:2(縦長)など整数値で画像比率を指定できます。 |
−−fast | 画像生成が早くなります。 |
−−quality −−q |
レンダリング品質にかける時間です。デフォルトは1です。 |
−−stylize −−s |
値を高く設定するほど、より芸術的になります。デフォルトの数は2500です。あまり高く設定しすぎると、予期せぬ方向に進みます。 |
Midjourney公式サイト(英文のみ)には、パラメーターが詳しく説明されているページがありますので参考にしてください。
Imagine Parameters Illustrated
Midjourney Botで作成した様々なタッチの生成画像と、そのテキストプロンプトを下記にご紹介します。
こちらも主題は同じく”Human Digital Consultants”ですが、SF映画のようなロボットの集団が現れました。
末尾に高品質レベルのレンダリング画像を生成する”Octane Render”, “Highly detailed”, “Photorealistic”や、世界観として”Cyber Punk”, “Cinematic”などを追記するのも効果的です。
遠近感のあるドラマチックな夕陽のライティングとなっています。
さらに”in Marvel Style”を追加すると、ロボットがマーベルヒーローのように変化しました。背景もニューヨークの街並みの雰囲気があります。
今回はマーベルヒーローの画像のURLを文頭に追加したので、かなり細かいところまで参考にしたようです。
こちらは”in Anime Style”です。「とある科学の超電磁砲」のような学園SFアニメ風のイラスト画像ですね。
きらめく都市のイラスト背景はMidjourney AIの得意なマテリアルとなっています。
“in Hayao Miyazaki style”とキーワードを変えると、空と飛行機内シーンのイラスト画像を生成しました。
しかしながら、人物キャラの顔造作やポーズのバランス調整は、まだ不得意なようですね。
“in Picasso style” ピカソ・スタイルとテキスト入力すると、アフリカ彫刻のようなオブジェや黒い切絵風ダンサーが現れました。
ノートパソコンもタッチが合わせてあり、なかなかいい感じです。
“in Dali style” ダリ・スタイルでは、重厚な油絵タッチで空に浮かぶ奇怪なオブジェと海面をめくるシュールなシーンを作成しました。
最後に“in Gogh style”ゴッホ・スタイルで試してみたところ、「星月夜」のような幻想的なイラスト画像に仕上がりました。
“Gogh”と名前だけの入力ですと、ゴッホの肖像が現れるので、入力テキストは“in Gogh style”とします。
さらに”Starry Night”と入れることで、ゴッホの代表作である「星月夜」のタッチに合わせて生成してくれるようになります。
思い通りの絵を描かせるにはかなりテキスト構文の工夫が必要ですが、分野によってはかなりハイレベルの画像生成を行ってくれました。
ユーザーが増えるに従って、生成AIは学習すればするほど賢くなるので、今後はどんどん正確な絵を描くことは可能となるでしょう。
Midjourney Showcase には、ユーザが作成した優れた作品がたくさん並んでいますので、プロンプト(指示文)とパラメーター(変数)の参考にどうぞ。
作品のコマンド(プロンプトとパラメーター)をコピー&ペースト可能なので、それらでどんな効果が得られるのかお試し下さい。
※Midjourney AIで生成された画像は、基本的にユーザー側に著作権がありますが、Midjourney運営側が自由に使うことがあります。
ビジネスへのAI導入についてご関心や疑問をお持ちでしたら、ぜひとも当社へお気軽にご相談下さい。
ヒューマンデジタルコンサルタンツへ、お気軽にお問い合わせ下さい!
関連記事:プロンプトエンジニアリング(Prompt Engineering)で、新たなイメージの世界を創造しよう。
関連記事:AIは白い狐の夢を見るか 画像生成AIを比較してみる。
関連記事:テキスト情報からイラスト画像を自動生成するAI、Midjourney(ミッドジャーニー)の衝撃。
関連記事:AI-OCRを使って千年の文字文化を復興する。
関連記事:Matterport Axisとスマートフォンを使って、手軽にデジタルツインが作成できる。