O Genie 2 é o sucessor da DeepMind para o Genie e promete gerar mundos e cenas interativas a partir de uma única imagem e uma curta descrição de texto. A iniciativa é semelhante ao que está a ser feito pela World Labs e pela Decart. A DeepMind explica que o Genie 2 consegue gerar “uma vasta diversidade de mundos 3D ricos”, onde as personagens podem saltar, nadar ou circular com recurso ao rato e ao teclado. O modelo é capaz de simular interações com objetos, animações, luzes, reflexos, física e o comportamento de personagens não jogáveis.
O material de treino deste modelo incluiu muitas sequências de jogos e é por isso que muitos dos seus resultados se assemelham a jogos AAA. A DeepMind não detalha os métodos usados para o treino, nem quais os conjuntos usados para as fontes. Sabe-se que, no passado, a Google deixou implícito que os Temos de Serviço do YouTube davam-lhe autorização para usar vídeos do YouTube para treinar modelos de IA. No caso do Genie 2, isto poderá significar que o modelo está a criar cópias não autorizadas dos vídeos de jogos que viu no YouTube, mas a questão terá de ser resolvida em tribunal.
Segundo a DeepMind, o algoritmo consegue criar visões de mundos com perspetivas na primeira pessoa e em isometria que duram até um minuto, mas a maior parte fica-se pelos 10 a 20 segundos. O Genie 2 consegue lembrar-se de partes de cenas simuladas, evitando assim ter alucinações ou problemas de consistência, algo que acontece em soluções de outras empresas.
Esta ferramenta não pode ser usada ainda para criar jogos completos, onde os níveis só teriam um minuto no máximo, mas sim como uma forma de realizar experiências interativas em protótipo e avaliar outros agentes de IA. “Ao usar o Genie 2 para criar ambientes diversos e ricos para os agentes de IA, os nossos investigadores conseguem gerar tarefas de avaliação que os agentes não tenham visto nos treinos”, conta a empresa em comunicado.
Na indústria dos videojogos, este avanço pode ser recebido com um misto de sensações: um trabalho recente da Wired, por exemplo, conta que estúdios como a Activision Blizzard despediram muitos trabalhadores e passaram a usar IA para aumentar a produtividade, atalhar caminho e compensar as saídas de trabalhadores.