Gemini ImagenやDALL-Eを使った画像生成の方法を学びます
💡動画をピクチャインピクチャ機能で再生しながら、学習を進めてください。
画像生成AIは、プロンプトを入れるだけで高品質な画像が作れる時代です。しかも基本的に無料。気軽に試してみましょう。
このレッスンのゴール
まずは難しいことを考えずに、実際に作ってみましょう。ChatGPTとGemini、それぞれに以下のプロンプトを入れてみてください。
やってみよう:以下のプロンプトをコピペしよう
「IT系企業の会議室で、日本人が楽しく語らっている様子」
それぞれ1分くらいで画像が生成されるはずです。両方の結果を見比べてみましょう。雑なプロンプトでも、ここまでの画像が作れるのが今のAIの実力です。
Googleが提供する画像生成AI。雑なプロンプト一発でも驚くほど綺麗な画像が生成されます。現時点でクオリティは最高峰です。
Gemini Imagenの特徴
OpenAIが開発した画像生成AI。クオリティが高く、さらにウォーターマークが入らないのが大きなメリットです。
DALL-Eの特徴
前回のレッスンでも触れましたが、画像生成で特に威力を発揮するのが「AIにプロンプトを作らせる」テクニックです。
やり方
自分でゼロからプロンプトを考えるより、はるかに高品質な画像が生成されます。Geminiで試してみましょう。
用途に合わせて画像サイズを指定することも重要です。
実務で使えるアイコンを作るならChatGPTがオススメです。背景透過ができるのが決め手です。
やってみよう:以下のプロンプトをChatGPTに入れてみよう
「ピクトグラムを作成。色は緑色。パソコンがうまく動いて喜んでいる人。背景は透過させる。」
Geminiはアイコン作成に向きません。背景透過ができないため、一見できたように見えても実際には背景が残ってしまいます。アイコンやロゴの作成にはChatGPTを使いましょう。
長文の資料や情報を、視覚的にわかりやすくまとめることもできます。
使い方はシンプル
資料やテキストをAIにぶちこんで、「インフォグラフィックにして」の一言でOK。情報を図解化した画像が生成されます。
実は、ここで作った画像は動画の素材としても使えます。
動画生成AIでは、「1コマ目の画像を指定して、その画像を動かす」ということができます。つまり:
詳しくは次回の動画生成AIレッスンで実践します。今のうちに「画像生成は動画生成の準備にもなる」と覚えておきましょう。
このレッスンで、アートな画像はもちろん、実務で使えるアイコンや素材、動画の1コマ目まで作れるようになりました。
「これできるかな?」と思ったことは、大抵できます。まずは気軽に試してみてください。
⚠️ 著作権に関する注意
版権のあるキャラクターや作品に関する画像の生成には注意が必要です。特にGeminiは制限が緩く生成できてしまう場合がありますが、版権モノの画像は絶対に外部に公開しないでください。
作った画像は、ぜひ札幌すごいAI会のDiscordに投稿してみてください。次のレッスンでは、生成した画像を動かす「動画生成AI」について学びます。