Pode ser um robô, mas não é por isso que deixa de ter um nome. Esta máquina de ‘quatro patas’ chama-se Jueying e é o destaque de capa da mais recente edição da publicação Science Robotics. O que tem de especial? Está a aprender, sozinho, a responder ao ‘caos’ do mundo que o rodeia – seja a caminhar num terreno cheio de pedras ou a defender-se de pontapés e empurrões de humanos.
O projeto é uma investigação conjunta das universidades de Zhejiang, na China, e Edimburgo, na Escócia. O grande elemento diferenciador deste cão-robô é como a equipa está a tirar partido de diferentes algoritmos de aprendizagem por reforço (reinforcement learning) para aprender a adaptar-se às condições que o rodeiam.
Cada um destes algoritmos aprende uma habilidade específica – como trotar ou levantar se cair de costas – e é compensado ou retratado – de forma digital –, respetivamente, se fizer algo que é considerado como ideal ou não ideal. Estes algoritmos são treinados primeiro num simulador digital e só depois integrados no hardware propriamente dito.
Como explica a revista Wired, o Jueying tem integrados oito algoritmos distintos, cada um com o objetivo de ajudar o robô a produzir comportamentos complexos que o façam mover-se e ultrapassar obstáculos. Estes algoritmos estão depois ligados entre si através de um sistema central, que usa, em tempo real, uma combinação da resposta dos diferentes algoritmos para que o cão consiga ultrapassar os tais obstáculos.
É por isso que quando o cão-robô é pontapeado ou empurrado, consegue ter uma resposta coordenada entre os diferentes algoritmos para criar uma resposta de defesa. Se for pontapeado, o robô vai rolar depois de cair, para que se possa levantar de imediato. Se estiver a percorrer um percurso com pedras e cair, vai levantar-se e prosseguir a marcha, adaptando-se à irregularidade do terreno.
Os investigadores consideram que esta é a abordagem de software mais adequada para os robôs, já que é muito difícil codificar linha a linha todas as respostas possíveis que o robô pode dar a um determinado obstáculo. Com este método, os algoritmos aprendem a ser mais eficazes e trabalham em conjunto para atingir o melhor resultado possível.
“A abordagem através de Inteligência Artificial é muito diferente, no sentido em que captura uma experiência, que é baseada em centenas de milhares de tentativas do robô, ou até mesmo milhões de tentativas”, explicou o investigador especializado em robótica Zhibin Li. “No ambiente simulado, posso criar todos os cenários possíveis. Posso criar diferentes ambientes ou diferentes configurações. Por exemplo, o robô pode começar numa posição diferente, como estar deitado no chão, de pé, a cair e por aí fora”.
Segundo o perito, “vamos ter máquinas mais inteligentes, que são capazes de combinar competências flexíveis e adaptáveis em tempo real, para responderem a uma variedade de tarefas que nunca viram”.