Gemini 2.5 Flash Image(nano-banana)の使用と比較

この記事は約7分で読めます。
スポンサーリンク

やりたいこと

Gemini 2.5 Flash Image(nano-banana)を使用しGemini 2.5 Flash Imageと比較します。

Gemini 2.5 Flash Image(nano-banana)は画像修正に優れていると言われています。

スポンサーリンク

使用方法

Google AI Studioにアクセスします。

Google AI Studio
The fastest path from prompt to production with Gemini

画面右上赤枠の箇所がGemini 2.5 Flash Image Previewもしくはnano-bananaになっていることを確認します。

別のものになっていたらクリックして変更します。

あとは下のエディットボックスにプロンプトを入力して実行します。(リターンでは実行されません。右側のRunボタンをクリックするか、Ctrl+returnを行います。)

画像のインプット

プロンプトを入力するエディットボックスに画像をドラッグアンドドロップします。

(右側の+からも読み込めます)

新しいチャットの開始

画面左側のChatをクリックします。(Gemini 2.5 Flash Imageは一度画像を生成すると生成した画像を修正しようとする傾向があります。あたらしい画像を生成する場合、新しいチャットを生成資することをお勧めします。)

スポンサーリンク

比較

画像生成

英語プロンプト

Prompt

A photorealistic close-up portrait of an elderly Japanese ceramicist with
deep, sun-etched wrinkles and a warm, knowing smile. He is carefully
inspecting a freshly glazed tea bowl. The setting is his rustic,
sun-drenched workshop. The scene is illuminated by soft, golden hour light
streaming through a window, highlighting the fine texture of the clay.
Captured with an 85mm portrait lens, resulting in a soft, blurred background
(bokeh). The overall mood is serene and masterful. Vertical portrait
orientation.

翻訳

深いシワが刻まれ、温かく物知りな笑顔を浮かべた年配の日本人陶芸家の、写実的なクローズアップポートレート。彼は、焼き上がったばかりの茶碗を丁寧に吟味している。舞台は、素朴で陽光が差し込む彼の工房。窓から差し込む柔らかい夕方の光が、粘土の繊細な質感を際立たせている。85mmのポートレートレンズで撮影されており、背景は柔らかくぼかされている(ボケ)。全体的な雰囲気は穏やかで、熟練の技が感じられる。縦長のポートレート。

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

ともに画像はプロンプト通りに作成されていると思いました。

ただGemini 2.0 Flash Image(nano-banana)では縦長、というのが無視されているようです。(モデルではなく環境の可能性もあります。)

日本語プロンプト

Prompt

深いシワが刻まれ、温かく物知りな笑顔を浮かべた年配の日本人陶芸家の、写実的なクローズアップポートレート。彼は、焼き上がったばかりの茶碗を丁寧に吟味している。舞台は、素朴で陽光が差し込む彼の工房。窓から差し込む柔らかい夕方の光が、粘土の繊細な質感を際立たせている。85mmのポートレートレンズで撮影されており、背景は柔らかくぼかされている(ボケ)。全体的な雰囲気は穏やかで、熟練の技が感じられる。縦長のポートレート。

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

プロンプトは日本語にしても結果は同様でした。

日本語で画像性をする場合”XXな画像を描いて”や”XXな画像を作成して”というと生成してくれないことが多かったです。”XXな画像”というようなプロンプトでかつより詳細に記載した方が画像生成してくれます。

ロゴ作成

今回のモデルがかなりすごいと思ったのがロゴ作成です。

英語プロンプト

Prompt

Create a modern, minimalist logo for a coffee shop called 'The Daily Grind'.
The text should be in a clean, bold, sans-serif font. The design should
feature a simple, stylized icon of a a coffee bean seamlessly integrated
with the text. The color scheme is black and white.

「The Daily Grind」という名のコーヒーショップのために、現代的でミニマルなロゴを作成してください。

テキストは、クリーンで太い、 sans-serifフォントを使用すること。デザインには、コーヒー豆をシンプルに様式化したアイコンをテキストとシームレスに統合させること。配色は白黒です。

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

好みの問題もあると思いますがGemini 2.0 Flash Imageでは文字が読めずGemini 2.0 Flash Image(nano-banana)の方がいいように思いました。

画像修正

Gemini 2.5 Flash Image(nano-banana)で優秀とされる画像の修正を試します。

インプット画像

背景の変更

Prompt

change background to town

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

背景の変更(日本語)

Prompt

背景を町に変更

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

失敗(画像が出力されませんでした。)

この画像だとGemini 2.0 Flash Imageでも元画像を忠実に再現してくれていますが、画像によっては元画像が全然異なるものになることがありました。(下参照)

また日本語だとうまく伝わらないことがあるようなので画像編集は英語で行った方がよさそうです。

その他

Styleの変更(Manga Style)

この例だとGemini 2.0 Flash Image(nano-banana)の方が原画に忠実であることがよくわかります。

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

感情の変更(Cry)

この例だとGemini 2.0 Flash Image(nano-banana)の方が原画に忠実であることがよくわかります。

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

帽子の追加(Add Hat)

たまたまかもしれませんがGemini 2.0 Flash Image(nano-banana)の方が雰囲気に合った帽子が追加されました。

Gemini 2.0 Flash Image

Gemini 2.0 Flash Image(nano-banana)

コメント

タイトルとURLをコピーしました