A ferramenta de geração de imagens com inteligência artificial do Google começou a ser disponibilizada em mais de 100 países, inclusive no Brasil. Chamado de Whisk, o serviço ainda está em fase experimental e é capaz de combinar as diversas capacidades do Gemini com a criação do Imagen 3, podendo criar imagens completamente novas tendo como base as inspirações oferecidas pelos usuários.
Inicialmente lançado somente nos Estados Unidos em dezembro, o Whisk é mais um teste do Google Labs, que é a plataforma de soluções experimentais da empresa. Essa ferramenta começou a ser disponibilizada para teste em diversos países a partir da última terça-feira (11).
O Whisk é uma ferramenta que oferece mais acessibilidade para usuários que não tem experiencia com criação de prompts, o que é fundamental na geração de imagens. Seu processo de edição é prático e intuitivo, e ele também oferece sugestões para aqueles que precisam de inspiração.
A IA Whisk utiliza o Gemini, o modelo multimodal do Google, para interpretar as imagens enviadas pelos usuários. A partir do arquivo, a IA gera uma descrição em texto chamada “Image to Text” (I2T) destacando elementos como estilo, personagens, cenário e paleta de cores.
Com base nessa descrição, a IA elabora um prompt detalhado que servirá como referência para a criação da nova imagem. O usuário pode especificar aspectos como o tema central, o ambiente ou o estilo visual desejado. Em seguida, o Imagen 3 converte essa solicitação em uma nova ilustração por meio do processo “Text-to-Image” (T2I). A partir disso também é possível pedir que a IA combine elementos de diferentes imagens.
O Whisk é uma plataforma completamente gratuita, mas é necessário fazer login no Google Labs com uma conta do Google. Além da IA voltada para edição de imagens, a ferramenta oferece outras opções experimentais, como o Daily Listen, um Discover narrado por vozes sintéticas; o NotebookLM, um assistente dedicado a estudos; e o Jules, que serve como assistente para programação.
Via: TecMundo
Imagem: Christian Wiediger/Unsplash