Pela primeira vez, um sistema de Inteligência Artificial (IA) conseguiu completar uma tarefa complexa no Minecraft sem ter tido ajuda ou explicações prévias por parte de humanos. O Dreamer, desenvolvido pela DeepMind, conseguiu recolher diamantes, uma tarefa que exige vários passos, sem que um humano tenha explicado antes como fazê-lo. Este passo representa um avanço na forma como as máquinas vão poder generalizar a aprendizagem em novas situações e em cenários complexos.
Danijar Hafner, que fez parte da equipa da DeepMind que desenvolveu a solução, explica que “permite à IA perceber o ambiente físico que a rodeia e também como auto-melhorar com o passar do tempo, sem ter um humano a fornecer instruções exatas do que tem de fazer”, cita a Nature.
O caráter aleatório do Minecraft, um jogo de simulação de um mundo 3D com uma variedade de terrenos e objetos, torna-o um ambiente útil para desafiar sistemas de IA onde os investigadores pretendam que seja possível generalizar de uma situação para outra. “Tens mesmo de entender o que está à tua frente, não podes apenas memorizar uma estratégia específica”, afirma Hafner.
O progresso conseguido na recolha de diamantes no jogo é reconhecido pelos pares: Jeff Clune, que não fez parte da equipa, mas já treinou um programa para fazer esta tarefa com recurso a vídeos de jogadores humanos em ação, afirma que “é inquestionável que isto representa um grande passo em frente neste campo”.
O foco da equipa da DeepMind foi a recolha de diamantes pela complexidade e múltiplos passos envolvidos, desde encontrar árvores, transformá-las em madeira, construir uma mesa, criar uma picareta e a partir daí escavar até encontrar o diamante. Em iniciativas anteriores, os investigadores usaram vídeos de jogadores humanos em ação ou lideraram o caminho passo a passo para o sistema encontrar as gemas. No Dreamer, o sistema explora o jogo por si mesmo, usando técnicas de tentativa e erro e de aprendizagem por reforço.
A chave do sucesso desta experiência passa pela construção de um modelo do ambiente envolvente e a utilização deste mundo para o sistema imaginar cenários futuros e guiar as suas decisões. O agente Dreamer consegue testar coisas assim e prever as recompensas potenciais para as diferentes ações, usando menos poder de computação do que se tivesse de o fazer no jogo Minecraft. A abordagem pode ser usada, por exemplo, para treinar robôs a agir no mundo real.