O Google Labs, braço experimental do Google, é testando um novo gerador de imagens chamado Whisk. Esta ferramenta permite que as pessoas exibam imagens em vez de texto, permitindo remixar uma foto alterando o tema, a cena e o estilo.
Whisk usa o modelo de geração de imagens do Google, Imagem 3, para combinar três imagens: uma para o tema, uma para a cena e uma para o estilo. Por exemplo, você pode selecionar uma foto sua como tema, uma paisagem futurista como cena e um estilo anime para o visual final.
O modelo gera automaticamente uma legenda detalhada para suas imagens, que é então usada para orientar a Imagem 3 na criação de um remix da foto. Você também pode inserir mensagens de texto para definir melhor o resultado desejado, incluindo descrições detalhadas como “O sujeito está andando de bicicleta voadora”.
Como o Whisk se concentra apenas em alguns recursos principais de cada imagem, a empresa explica que os resultados nem sempre atendem às suas expectativas. Por exemplo, o sujeito gerado pode diferir em altura, peso, penteado ou tom de pele. O Google diz que você pode visualizar e editar as solicitações subjacentes a qualquer momento.
No momento, o experimento está disponível apenas para usuários dos EUA em labs.google/whisk.