Googleは2月12日から、Google Labsにてた画像生成の試験運用機能 Whisk を日本を含む 100 以上の国と地域で順次提供開始しました。Google Labsとは、Gemini、Imagen、Veoなどの最新の生成 AI モデルを活用できる試験開発エリアのことで、今回新たにWhiskが追加された形です。
この「Whisk」は、テキストを用いたプロンプトではなくモデル、シーン、スタイルの3枠に好きな画像を当てはめることで、ユーザーが想像している、それらを組み合わせた画像を生成することができます。
例えば、下画像のようにモデルに犬、シーンに雪国、スタイルに恐竜のぬいぐるみを当てはめると、それらを組み合わせた全く新しい画像に!なぜアイスクリームを食べているのかは分かりませんが、このようなオリジナルな画像を生成できます。

次はこちら。モデルに猫、シーンに浜辺、スタイルにはガチャガチャのカプセルに入った恐竜の画像を当てはめると、何ともかわいらしい浜辺をバックにしたカプセルに入る猫の画像が生成されています。

このように3つの画像からオリジナルの画像を生成する「Whisk」の仕組みとしては、まずGemini が画像の詳細なキャプションを自動的に作成します。次にその作成した説明を Google の最新の画像生成モデルである Imagen 3 に入力することで上の画像が生成されるというわけです。Googleによると、このプロセスは、入力したモデルを正確に複製するのではなく、被写体の本質を捉えるため、モデル、シーン、スタイルを新しい方法で簡単に組み合わせることができるとのこと。
ただし注意点として、Whisk は画像からいくつかの重要な特徴のみを抽出するため、ユーザーが予期するものとは異なる画像が生成される場合があります。たとえば、生成されるモデルの身長、体重、髪型、肌の色が異なるなどです。
Googleは、そうして問題に対して、いつでも基となるプロンプトを表示および編集できるようしているようです。また、GoogleはWhiskを最大限に活用していただくために、英語でのプロンプトのご使用を推奨しています。一応日本語の注力もできるかもしれませんが、英語の方が良いみたいです。
テキスト入力がなく、自分が生成したい画像を元に直感的に画像を3枚選ぶだけなので初心者にとっては他のモデルよりも使いやすいかもしれませんね。日本ではすでにこのサイトで提供されるようなので、気になった方はぜひ試してみてください!
楽天モバイルは、安さが魅力のシンプルプラン!(PR)

スマホのモバイル通信なら楽天モバイルがオススメ!楽天モバイルの回線は、「Rakuten最強プラン」の1つだけなので、プラン選択に悩む必要がありません。また、、料金の安さも楽天モバイルの魅力です!
その月のデータ通信が0~3GBだと880円/月(税込968円)、3~20GBだと1880円/月(税込2068円)、20GB以上(無制限!)だと2880円/月(税込3168円)!追加オプションを設定しなければ、これ以上料金はかかりません。
筆者は月に15GBほど使うのですが、一切オプションを追加せず毎月2068円で済んでいます!
通信データに応じて料金が変化するので、あまりデータを使わない人やある程度使う人、ゲームや動画で何十GBも使う人まで全てのユーザーに対応できるのが楽天モバイルの魅力です。また、専用の通話アプリ「Rakuten Link」から電話を掛けると通話料金がなんと無料になります!
回線の新規申込や切り替えもオンラインで完結するので、わざわざ店舗に出向く必要もありません。(申込方法が分からない方は、店舗や電話で相談することも可能!)
自分に合うプランが分からない、他社回線を使っているけど毎月の請求額に悩んでいるという方は、ぜひ試してみてください!
