A Google anunciou o Veo 3, a mais recente versão do modelo de geração de vídeo com inteligência artificial, que pela primeira vez inclui áudio sincronizado com as imagens, como diálogos entre personagens, sons ambientes e efeitos sonoros
O anúncio foi feito durante o Google I/O, o evento anual da gigante norte-americana que decorre em Mountain View, EUA, e integra um conjunto de novas ferramentas criativas desenvolvidas pela Google DeepMind. O Veo 3 representa um avanço significativo face ao seu antecessor, não apenas pela introdução de som, mas também pela capacidade de compreender e transformar descrições complexas em cenas realistas, com física detalhada, movimentos naturais e som ambiente. O modelo consegue interpretar histórias curtas escritas pelos utilizadores e gerar vídeos com animações, expressões faciais e áudio perfeitamente integrados na narrativa.
Veja abaixo exemplos de geração de vídeos do Veo 3:
Colaboração com criadores e novas ferramentas
Segundo a Google, o desenvolvimento do Veo 3 envolveu uma colaboração próxima com profissionais do cinema, da música e das artes visuais, com o objetivo de fornecer uma ferramenta criativa útil e responsável. A empresa sublinha também o uso da tecnologia SynthID, que marca digitalmente os conteúdos gerados por IA para evitar desinformação ou atribuições erradas.
Em paralelo, a Google anunciou melhorias no modelo anterior, o Veo 2, incluindo controlo de câmara, expansão de enquadramento (outpainting) e edição de objetos em cena, além do lançamento do Flow, um estúdio virtual onde é possível criar filmes com base em texto, referências visuais e direções estilísticas.
O Veo 3 junta-se agora à nova geração de modelos generativos da Google, que inclui também o Imagen 4 (criação de imagens com tipografia avançada) e o Lyria 2 (música generativa interativa).
A nova versão do Veo 3 está, para já, disponível apenas nos Estados Unidos, através da aplicação Gemini, para subscritores do plano Ultra, e para empresas via Vertex AI. O modelo pode também ser utilizado na Flow, a nova plataforma da Google dedicada à produção cinematográfica com inteligência artificial.