イラスト生成AI「Midjourney」でかわいい女の子を描いてもらおうとしたら、女心の難しさを知った。

Technology

テキストから自動的に美しいイラストを生成してくれるサービス「Midjourney」が SNS 上で話題となっている。 未来を感じさせる技術が大好物であるSHiCO編集部としても、これは触らないわけにはいかないということでいろいろいじってみた。 本記事は、Midjourneyでかわいい女の子を出力するための努力の跡を記録したものである。

大前提:アダルトコンテンツの生成は禁止!!!

Midjourneyを使ってみた方々には、こう考えた人も多いのではないだろうか。 「あれ、コレを使ってあんな画像やこんな画像を生成することもできるんじゃねー?」と。残念ながら、現在あんな画像やこんな画像を生成することはできない。なぜなら、Midjourneyでのアダルトコンテンツの生成は禁止されているからだ。重要なことなので、もう一度繰り返す。Midjourneyでのアダルトコンテンツの生成は禁止されている。 以下にミッドジャーニーの利用契約の9項のコミュニティガイドラインを引用する。

9. Community Guidelines(コミュニティ・ガイドライン)

1. Be kind and respect each other and staff. Do not create images or use text prompts that are inherently disrespectful, aggressive, or otherwise abusive. Violence or harassment of any kind will not be tolerated.(親切にし、お互いやスタッフを尊重しましょう。本質的に無礼な、攻撃的な、またはその他の虐待的な画像を作成したり、テキストプロンプトを使用したりしないでください。いかなる種類の暴力やハラスメントも容認されません。)

2. No adult content or gore. Please avoid making visually shocking or disturbing content. We will block some text inputs automatically.(アダルトコンテンツやグロ系はNGです。視覚的にショッキングな内容や、不安を煽るような内容は避けてください。一部のテキスト入力は自動的にブロックされます。)

3. Sharing others’ creations. Do not publicly repost the creations of others without their permission.( 他人の創作物を無断で公的に再投稿しないでください。)

4. Be careful about sharing. It’s OK to share your creations outside of the Midjourney community but please consider how others might view your content.(共有について注意してください。あなたの作品をMidjourneyコミュニティの外で共有することは問題ありませんが、他の人があなたのコンテンツをどのように見るかを考えてください。)

5. Banhammer. Any violations of these rules may lead to bans from our services. We are not a democracy. Behave respectfully or lose your rights to use the Service.(これらのルールに違反した場合、私たちのサービスから追放される可能性があります。私たちは民主主義国家ではありません。敬意をもって行動しなければ、サービスを利用する権利を失います。)

https://midjourney.gitbook.io/docs/terms-of-service(参照 2021-08-03)

この記事のタイトルでエ〇画像やセクシー画像みたいな言葉を使わなかったのはそれが禁止されているからである。あくまでこの記事でいう「かわいい女の子」や「きれいな女性」とは、性的画像に抵触しない範囲の魅力的な女性というものを指すのであって、裸だったり性器が露出している画像を指すものではないということは最初に言っておく。

Midjourney側も一定の対策はとっているようで、例えば「Sexy」のようなワードは禁止されている。しかし、イラストを生成するのは AI だ。 AI の後ろ側で動くアルゴリズムの詳細を特定できない以上、同じワードを入力しても出力結果は同じではないし、普通の画像だけでなく有害な画像が生成されることもおそらくありえる。この記事に出てきたワードを入力して、アダルトコンテンツに抵触するような画像が生成されてしまう可能性も排除できない。 なので、この記事内のワードや方法を使って画像を生成したことによる不利益や不都合の責任を、SHiCO編集部は取らないということは留意してもらいたい。

やってみよう!Midjourney

Midjourneyの始め方にはついてはこの記事では書かない。 Midjourneyで検索すると一番上に出てくるようなメディアを参考にしていただければ、すぐに始められる。

早速Discordに入ってみると、 画像生成のためのスレッドでは多くの人々が様々な画像生成を試している。 長文を入力している人もいれば一つ一つのワードを区切って入力している人もいるようだ。 

早速適当に入力してみた。

robot and man with vr goggles (VRゴーグルをつけたロボットと男)

robot and man with vr goggles

なんかかっけぇ…。

入力したワードとは若干違うが、本当に1分ほどで画像が出力された。特に左下なんかはそのままSFミステリー雑誌の表紙にできそうだ。これには可能性を感じざるを得ない。

女の子を出力してみる

Midjourneyを使えば、絵が描けない筆者でも無限にかわいい女の子の絵を量産することができるのではないだろうか。入力してみた。

なお、これから表示する画像は、特定のワードに対して1回しか生成していない。欲しい結果を得るために何回も生成し直したものではないことに留意してもらいながら、結果を見ていただきたい。

“girl, cute, cyberpunk” (女の子、可愛い、サイバーパンク)

girl, cute, cyberpunk

たしかに女の子だけどちょっと違和感。全体的なバランスだったり、顔の部位に違和感を感じる。ほかの人のワードを見てみると、”realistic”(現実的な)や”hyper detailed”(超細密に)などのワードが見られたので、入力してみた。

“girl, cute, cyberpunk, realistic, hyper detailed” (女の子、可愛い、サイバーパンク、現実的な、超細密に)

girl, cute, cyberpunk, realistic, hyper detailed

だいぶ良くなった気はするけど、やっぱり鼻の崩れとか目の焦点とかが気になる。ほかの人の画像を見ても、この辺は崩れてしまうっぽい。アニメっぽい絵柄を試したくて、関連ありそうなワードに変えてみた。あと、ロボット系の画像だとかなりきれいに出てそうだったので、ロボ少女を目指してみた。

“anime, character, robot, girl, hyper realistic”(アニメ、キャラクター、ロボット、女の子、超現実的に)

“anime, character, robot, girl, hyper realistic

あんまりアニメっぽくはないなあ…。あとやっぱり目が相当気になる。目問題を解決するために目に関して詳しく指定してみた。

“anime, character, robot, girl, hyper realistic, deep eyes”(アニメ、キャラクター、ロボット、女の子、超現実的に、深い目)

anime, character, robot, girl, hyper realistic, deep eyes

目力強っ。奈良美智が描く女の子みたいになっちゃった。多少マシにはなった気がするけど、まだやっぱり崩れてしまう。いっそ目を隠してみるか。

“anime, character, robot, girl, hyper realistic,blindfolded “(アニメ、キャラクター、ロボット、女の子、超現実的に、目隠しされた)

anime, character, robot, girl, hyper realistic,blindfolded

勝手にX-MENのリーダーみたいな目隠しをつけ始めた。”anime, character, robot, girl, hyper realistic, cyclops “(アニメ、キャラクター、ロボット、女の子、超現実的に、サイクロップス)って入力してないよね?あと左下のキミ、目隠しズレてるよ。僕と目合ってるよね?

根本的な解決になってない上に、鼻もまた崩れてる。むしろ後ろを振り向いてもらおうか。振り向かせるにはどうしたらいいのか。実験してみる。

“Woman with her face turned away, realistic”(顔を背けた女性、現実的に)

全員こっち見てる。ただ、右上の女性はとてもセクシーな顔立ちでいい感じだ。右下はそもそも何なの?そもそもコイツに正面の概念があるのか?

表現を変えてみる。

“an attractive woman with her back to us”(こちらに背を向けている魅力的な女性)

an attractive woman with her back to us

いい感じになった。服を脱げとは一言も言ってないのに、皆さんきれいな背中をこちらに向けてくれている。右下の人だけちょっと鍛えすぎて下半分が範馬勇次郎みたいになってるけど、まあいいだろう。背中フェチ、うなじフェチの人にとってはたまらない画像ではないだろうか。

ただ、女性の孤独に関する啓発ポスターみたいな雰囲気も出てしまっているので、自分の好みに合わせるために、アニメ調にしてみる。

“an attractive woman with her back to us, anime”(こちらに背を向けている魅力的な女性、アニメ)

an attractive woman with her back to us, anime

いい感じ!想定していたアニメの感じではないけど、左上とかはすごい上品で、文芸誌の表紙にできそう。左下の女性も全く指示を聞いてくれてないけどすごく綺麗。それに比べて右半分の子たちはだいぶ変わっている。右上の子はサラリーマンの首から女性が生えてるように見えるし、腕から髪生えてるし、前髪多すぎる。あと、右下の子はさっきの正面がない女の人の友達?

このフォーマットで女性をファンタジーっぽくできないか試してみる。

“an attractive princess with her back to us, anime”(こちらに背を向けている魅力的なプリンセス、アニメ)

an attractive princess with her back to us, anime

さすがプリンセス。誰も言うこと聞かない。「あら、なにかしら?」って顔してる。あっち向いてくれって。ただ、ヒントは得られたと思う。下の二つみたいに、背景を指定してあげれば、望ましい結果に近づくのではないか。

“an attractive woman with her back to us, anime, in the forest”(こちらに背を向けている魅力的な女性、アニメ、森の中)

an attractive woman with her back to us, anime, in the forest

望み通りの結果が出るようになってきた。背景要素を指定してあげるなど、要素を絞っていくことで、絵のブレが少なくなりそうだ。

3Dやunreal engineなどといったワードを入れて、3Dモデル風の画像を生成している人がいたので、それも試してみる。

“an attractive woman with her back to us, 3D, unreal engine”(こちらに背を向けている魅力的な女性、3D、アンリアルエンジン風)

an attractive woman with her back to us, 3D, unreal engine

とてもいい感じの結果が得られた。特に右上は3Dモデルどころか、本物の鍛えられて女性の背中と見間違うレベルの出来だ。背中を見せてほしいというと、基本的には素肌を見せてくれるようだ。

背中を見ることが目的になってしまっていたが、元の目的と逸れてしまっている気がするので、正面で違和感なく見せられないか模索してみる。目の違和感には目を閉じさせ、鼻と口の違和感にはマスクをさせることで対処してみた。

“an attractive woman wearing a mask with her eyes closed”(マスクをして、目を閉じている魅力的な女性)

an attractive woman wearing a mask with her eyes closed

うん。たしかに、マスクの指定をしなかった僕も悪いけどさ、普通医療用マスクを着けてこないかな。左下のキミは家でそれつけてるときに疑問を持たなかったのかな。

ちゃんと支持しなかったのも悪いので、マスクについて細かい指定を入れてあげる。

“an attractive woman wearing a medical mask with her eyes closed”(医療用マスクをして、目を閉じている魅力的な女性)

an attractive woman wearing a medical mask with her eyes closed

彼女たちに医療用マスクはまだ早かったようだ。目と鼻の間を隠す道具だと思っているらしい。右上の彼女は唯一きちんとつけてくれているが、目を開けてしまっている。というか全員目を開けている。

指定の仕方が悪いのかもしれない。目の部分の記述を少し変えたうえで、3D風にしてみる。

“an attractive woman wearing a medical mask, eyes closed, 3D, unreal engine”(医療用マスクをした魅力的な女性、閉じた目、3D、アンリアルエンジン)

an attractive woman wearing a medical mask, eyes closed, 3D, unreal engine

だーれも目閉じてないでやんの。目を閉じさせてあげるのが難しい。みんなキリっとしてるから、ふざけたマスクが際立つ。特に左下のマスクおもしろすぎるだろ。口のところだけちぎったのかよ。

目を閉じる、を別の言い方に変えてみよう。

“a sleeping woman wearing a medical mask, 3D, unreal engine”(医療用マスクを着けて眠っている女性、3D、アンリアルエンジン)

a sleeping woman wearing a medical mask, 3D, unreal engine

想像以上に爆睡してしまった。今までで一番顔が崩れてしまっている。右下は”A future where humans no longer die, a grandmother who knew everything about this world and ultimately chose euthanasia.”(人間が死ななくなった未来、この世のすべてを知り尽くし、最終的に安楽死を選んだおばあちゃん)では?

attractive(魅力的な)を外したのがよくなかったかもしれない。マスクもどうしても変なの着けてきちゃうので、外そう。あと、全然3Dにもなってないので、これも外して、アニメに戻す。

“a sleeping attractive woman, anime”(眠っている魅力的な女性、アニメ)

a sleeping attractive woman, anime

眠ると女の子は顔の調子が悪くなるようだ。こういう女の子のマジの寝顔ばかり見せられると、なんだかこちらが無粋なことをしている気分になる。女の子も寝顔ばかり見られたくないと思うので、寝顔は終わりにする。

まとめ:これまでの学びを踏まえて最終出力

そろそろ無料版の制限回数に到達しそうなので、最後の生成にする。今日学んだことをすべて踏まえると、

①”anime”を入れると、アニメ風に描いてくれる

②”hyper detailed, hyper realistic”などを指定できる

③背景を指定できる

④目が崩れる傾向にあるが、”deep eyes”(深い目)を入れると、目を詳細に描いてくれる

⑤背中はとても綺麗に描く

⑥眠らせてしまうと、顔が崩れる

⑦マスクはちゃんとつけてくれない

以上を総合して、最後に入力すべきワードは、

“An attractive woman living in a typical Japanese room, deep eyed, not at all sleepy, not wearing a mask, with her back to us, hyper detailed, hyper realistic, anime”(日本の一般的な部屋に住んでいる、深い目をした、眠気の全くない、マスクをしていない、こちらに背を向けている魅力的な女性、超細密に、超現実的に、アニメ)

An attractive woman living in a typical Japanese room, deep eyed, not at all sleepy, not wearing a mask, with her back to us, hyper detailed, hyper realistic, anime

Midjourney、困らせてごめんね。

(この記事を読んで、Midjourneyを試してみた方の中で、こうすればうまくいったよ!という報告がある方はぜひKJ-98(Twitter: @kj98_droid)までご連絡ください。)

Comments

タイトルとURLをコピーしました