A Google já tinha demonstrado o potencial do Imagen 3 durante a conferência Google I/O e informou agora, em comunicado, que vai passar a disponibilizar este modelo de geração de imagens para o Gemini, Gemini Advanced, Business e Enterprise. Este modelo “estabelece um novo padrão na qualidade de imagem, gerando imagens com apenas algumas palavras” e o utilizador “pode até pedir ao Gemini para criar imagens em vários estilos – como paisagens fotorrealistas, pinturas a óleo com textura ou cenas animadas”, descreve a tecnológica.
O Imagen 3 tem funcionalidades avançadas com proteções integradas e apresenta um desempenho favorável em comparação com outros modelos de geração de imagens, numa vasta gama de diferentes benchmarks. As imagens geradas por este sistema são assinaladas com marca de água, com recurso à ferramenta SynthID, tal como acontece nas versões anteriores.
O utilizador pode começar por introduzir alguns comandos de texto e, se a imagem inicial não corresponder às expetativas, basta pedir as alterações e o Gemini devolve um novo resultado. Ao longo dos próximos dias vai ser possível começar a pedir a geração de imagens de pessoas, numa versão de acesso prévio para os utilizadores Gemini Advanced, Business e Enterprise em inglês. A Google explica que “não apoiamos a geração de imagens fotorrealistas, de indivíduos identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais”.
A empresa refere ainda estar recetiva a ouvir o feedback dos utilizadores com acesso prévio no Gemini Advanced para continuar a melhorar os algoritmos e os resultados finais.
Os utilizadores de Gemini Advanced ou inscritos no Gemini for Workspace vão estar entre os primeiros a poder experimentar estas novas funcionalidades.