てくこです。
前の記事で、おおきなかぶが抜けたあとの穴の絵をChatGPTに生成してもらうという、記事を書きました。
今考えても、なんでこんなことを書いたのかわからないのですが、「別のAIに同じ会話で描いてもらったらどうなるんだろう」と思ったので、今回はグーグルのAI「Gemini」に描いてもらうことにしました。
ちなみに無課金、設定は「ナノバナナ+思考モード」です。
1回目

タイミングにもよるかもしれないですが、1回目にChatGPTは手書きの絵、Geminiはリアルな絵を生成してくれました。
「株」と漢字で打ち込んでしまいましたが、「おおきなかぶ」の物語としっかり修正して描いてくれました。かぶ本体とかぶの何倍かありそうな穴を描いてくれました。
2回目

ほぼ正解の絵が返ってきました。ChatGPTは物語に出ていないはずの男の子が絵中に加わっていましたが、こちらではかぶを抜いていたメンバーがみんな揃って、かぶと大きな穴の前でポーズを撮っています。
3回目
私の考えていた理想の絵に近づかせように構図を指定してみました。

後ろを向いて帰っている感じが理想の絵と近くてとてもいいです。
おばあさんらしき人がひとりでかぶを担いでいる姿がパワフルです。おじいさんは気を利かせてほしいところです。
次の修正としては、穴の大きさの割にかぶが小さいので、かぶ抜きメンバーを遠くに配置してもらって、遠近感が合うようにしてもらおうと思いました。
4回目

かぶを人力で抜いた後の穴の見た目にこそなりませんでしたが、夕方の背景の選択はかぶを抜くために長い時間がかかったことを表現してくれているように見えます。
それを狙ってこの構図だったなら、おそろしい思考能力ですね。
Geminiは結構荒いお願いでも忠実に表現してくれるということがわかりました(思考モードとの組み合わせが良かった?)。是非、また生成おねがいします。
ちなみに無課金のせいなのか、「ナノバナナ+思考モード」で2回ほど使うとproの画像生成の上限が来てしまい、クオリティが下がりそうなので2日に分けてproで描いていただきました。
Geminiの会話のスクリーンショットって載せていいの?
ところで「Geminiの会話のスクリーンショットって載せていいの?」と思ったので直接Geminiに聞いてみましたが、一般的には問題ないそうです。個人情報とか著作権には注意してくださいとのこと。

続けて絵も載せていいか聞いたら、なぞの文章と絵がでてきてビビらせにきました。再度聞いたらOKと返してくれました汗。

ついでに手書きっぽい絵にもしてもらいました

絵のほうがおじいさん、おばあさんたちが見やすくなってさらに良い感じでした。
上手に構図を指示して理想の絵を作ってもらえるようにコツを掴んでいきたいですね。


コメント