À primeira vista parece uma versão digital daquilo que na gíria é conhecido como um jogo de futebol de solteiros contra casados: os jogadores são desengonçados, os toques na bola são atabalhoados e há golos marcados aos tropeços. Estariam reunidas as condições para um dos mais caricatos simuladores de futebol do mundo, não fossem estes jogadores controlados por Inteligência Artificial (IA). Mas esta não é uma IA qualquer: aprendeu do zero a ter que movimentar os jogadores e a jogar futebol. O objetivo final é usar esta experiência para ensinar a IA a mexer-se mais como um humano.
“Para conseguires ‘resolver’ o futebol, tens na realidade de resolver muitos problemas em aberto para uma Inteligência Artificial Generalista [IAG]”, explicou Guy Lever, investigador da Deepmind, empresa-irmã da Google especializada em sistemas e soluções de IA. “Há o controlo completo do corpo humanoide – o que é muito difícil para a IAG – e o domínio tanto de controlos motores de baixo nível e coisas como planeamento a longo termo”, acrescentou em entrevista à Wired.
Os humanoides digitais usados pela Deepmind para jogar futebol foram criados com base num corpo humano – existem 56 pontos de articulação e limitações nos movimentos que cada articulação pode fazer (para evitar, por exemplo, que um joelho dobre para trás). O que para os humanos é um ato natural – quando chutamos uma bola, não pensamos especificamente em cada uma das articulações que temos de mover, o movimento que cada membro terá de executar para criar equilíbrio no corpo e permitir aplicar força num objeto externo –, para a IA é um desafio super complexo, pois todas estas variantes têm de ser calculadas no momento. Num único segundo a IA tem de tomar centenas de decisões só para mexer o corpo do humanoide digital.
Primeiro a equipa da Deepmind tentou treinar a IA usando aprendizagem por reforço (reinforcement learning), um método que usa uma recompensa como objetivo para ‘obrigar’ o algoritmo a maximizar todas as suas ações com o objetivo de conseguir essa recompensa. Mas como em causa estava uma tarefa complexa, a IA não sabia sequer por onde começar para atingir essa recompensa – o que resultou em humanoides digitais a contorcerem-se no chão.
A equipa de investigadores passou então para outro método – motores primitivos de probabilística neural (NPMP na sigla em inglês). Estes algoritmos foram ‘alimentados’ com dados de movimentos de corpo de jogadores verdadeiros, recorrendo a fatos de captura de movimento (motion capture). Desta vez, a IA não só tinha um objetivo (jogar futebol), como tinha os dados que lhe permitissem aprender, sozinha, a concretizar esse objetivo.
Depois o sistema de IA foi treinado em tarefas específicas: correr, driblar, passar e chutar a bola. Foram-lhe dadas ‘recompensas’ específicas para reforçar a aprendizagem do algoritmo, como perseguir o adversário que tiver a bola ou fintar quando estiver na posse da bola e o adversário estiver por perto. E ao fim de muito treino, incluindo de jogos em que a IA desafia-se a si própria, os resultados começaram a aparecer.
No vídeo abaixo (a partir do minuto 4:10) consegue ver exemplos de ações complexas que a IA aprendeu a fazer sozinha: desde levantar um jogador do chão quando está caído; a picar a bola por cima do adversário; a desmarcar o colega de equipa; a baixar no terreno quando o adversário está a atacar; e a cortar a bola quando esta se dirige para a própria baliza.
Ou seja, a IA não só aprendeu a coordenar humanoides digitais de forma independente, como consegue já coordenar os seus movimentos em função de uma atividade muito mais complexa e do desenrolar de uma ação em tempo real.
Mas ao contrário de outros jogos que a IA da Deepmind já aprendeu a dominar – casos do xadrez e do Go –, o objetivo não é destronar os melhores humanos num jogo de futebol contra máquinas. O objetivo da tecnológica britânica é, acima de tudo, usar estas aprendizagens para ensinar a IA a mover-se de forma mais natural, tal como se fosse um humano.