之前介绍过 Google 发布的在线笔记 NotebookLM ,也介绍过 Google 发布的知识学习 Learn About ,Google 虽然在 AI 上落后了 OpenAI 一节,但是内部的各个团队一直都在探索 AI 的不同能力。今天要介绍的就是 Google 刚推出的图片生成工具 Whisk,Whisk 和其他图片生成模型 [[DALL E3]]、 [[Stable Diffusion]] 、[[Midjourney]] 有所不同,抛弃了通过文字生成图片的模式,而是通过图片和图片组合,合成来生成新的图片。

Xf-clsZSAu

Google Imagen 3

谷歌推出的 Whisk 融合了 DeepMind 的生成式 AI 技术、Gemini 的多模态能力和 Imagen 3 的文本到图像生成功能,打造出一个非常有意思的图片到图片生成 AI。

Imagen 3 是 Google 最新推出的人工智能图像生成工具,Imagen 3 可以生成极高质量的图片

  • 细节更丰富
  • 最高可生成 1024 * 1024 的高分辨率图片
  • 在多种风格中表现出色,从超写实到印象派风格都能呈现
  • 多模态,除文本外,可接受草图等多种输入

使用

Whisk 会组合三张图片,分别是 Subject(主体),Scene(场景),Style(风格),然后根据三个图片以及文字描述来生成最终的图片。

Bilibili YouTube