種々雑多な独り言

趣味や興味のあることの種々雑多な独り言。

ナノバナナ(Nano Banana)を使って立体的な画像を作成してみました

最近、Xの広告で目にしていたナノバナナ(Nano Banana)。

あまりちゃんと読んでいなかったのですが、改めて読んでみてGeminiにその特徴を聞いてみました。

 

「ナノバナナ(Nano Banana)」は、Googleが開発した最新の画像生成・編集AIモデルのコードネーム(愛称)です。正式名称は**「Gemini 2.5 Flash Image」**とされています。

その卓越した機能と性能から、特にクリエイターやコンテンツ制作者の間で非常に注目を集めています。


 

🍌 ナノバナナ(Gemini 2.5 Flash Image)の主な特徴

 

ナノバナナが従来の画像生成AIと比べて革新的とされる、主な特徴は以下の通りです。

 

1. 驚異的な「キャラクターの一貫性」

 

  • 同一人物・キャラクターの維持: 一度生成した人物や動物、キャラクターの顔の特徴や見た目を、異なるポーズや背景、状況で生成し直しても、高い精度で一貫性を保つことができます。

  • シリーズ作品に最適: 漫画、アニメのキャラクター設定、ブランド素材など、連続性や世界観の統一が求められるコンテンツ制作に特に強力です。

 

2. 高度な画像編集機能

 

  • ピンポイントな修正: 画像全体を再生成するのではなく、指定した一部の要素だけを自然な形で変更・編集できます(例:服装だけを変える、特定の背景にある不要な物を削除する、表情を変えるなど)。

  • 文脈の理解と演出力: 単に指示通りの絵を出すだけでなく、「ちょっと切ない感じ」や「緊張感あるシーン」といった曖昧な指示からも感情や雰囲気を汲み取り、シーンを演出してくれます。

 

3. 複数の画像やプロンプトの理解

 

  • 複数の画像を組み合わせた自然な合成が可能です。

  • 複雑なプロンプトや、設計図などの画像を参考にしたレイアウトの再現にも優れています。


 

💡 主な用途と活用シーン

 

これらの特徴から、ナノバナナは以下のような幅広い分野で活用されています。

  • 漫画・アニメ制作: キャラクターの一貫性を保ったまま、ストーリーの各シーンを効率的に生成。

  • マーケティング・広告: 商品写真の背景やモデルの服装を瞬時に変更し、様々なバリエーションの広告素材を迅速に作成。

  • ECサイト: 1枚の写真から、異なる角度、照明、またはカラーバリエーションの商品画像を量産。

  • リフォーム・設計: 平面図や簡単なスケッチから、リアルな完成予想図を生成し、顧客とのイメージ共有をスムーズにする。


ナノバナナは現在、GoogleのAIプラットフォームであるGeminiGoogle AI Studioなどを通じて利用できるようになっています。

 

ちょうど昨日にずっと使っているアイコンが顔の部分しかなかったので、ChatGPTで全身を描いてもらっていたキャラクターがあったので、それを立体的な画像にしてもらいました。

 

アイコン顔写真

                  ⇓⇓⇓

ChatGPTで作成した全身画像

                  ⇓⇓⇓

ナノバナナで作成した立体的な画像

適度なお腹の膨らみがかなりいい感じでこのキャラクターを利用してショート動画でも作成できたらなあと考えています。

AIフィギュア作成されている方もいらっしゃいましたが、これを利用しているんですね。

まあフィギュアは作らないと思いますが。

 

ずっと使っているこのアイコンは、おそらく14,5年前くらいにネット上で見つけたアイコンメーカーで作成したもので、どこで作ったのかも覚えておらず。

元の画像だけは残っていて、それをSNSで使っていました。

 

急に思いついたのが生成AIを使ったら全身画像も作れるんじゃないのかなと思って。

それに動きがつけられたら面白いなあと思ってうまく動画にできるところを今探しています。

 

ナノバナナの特徴のところにキャラクターの一貫性があるとなっていたので、このキャラクターを使っていろいろ表現できるようにしていきたいと思います。

 

ふと作ったアイコン画像が10年の月日が流れて生成AIの力を借りて動けるキャラクターにできるのはとても興味深く、感慨深いです。

 

 

これはGeminiに動画について質問していたら作られていた画像です。

画像作りにはChatGPTを使う事が多かったのですが、今後はGeminiも使っていこうと思います。