A DeepMind quer tornar o desenvolvimento de robôs de uso genérico mais rápido e anunciou um modelo de IA chamado RoboCat que pode ser decisivo neste processo. Os robôs atualmente conseguem desempenhar uma série de tarefas, depois de serem treinados em dados do mundo real e a nova abordagem da DeepMind permite saltar a necessidade desse treino, com o RoboCat a exigir muito menos interferência humana.
“O RoboCat aprende muito mais rápido do que outros modelos de topo de gama. Consegue aprender uma nova tarefa com apenas cem demonstrações porque aprende com um conjunto de dados maior e mais diverso. Esta capacidade vai acelerar a investigação na robótica, reduzir a necessidade de treino supervisionado por humanos e é um passo importante para criar robôs de uso genérico”, explicam os investigadores da DeepMind em comunicado citado pelo Interesting Engineering.
O novo modelo é baseado no modelo multimodal Gato da DeepMind e é capaz de processar linguagem, imagens e ações em ambientes simulados e físicos. Para o RoboCat, os investigadores recolheram entre cem e mil demonstrações de uma nova tarefa ou um novo robô, com um braço robótico controlado por um humano, depois afinaram o modelo para esta nova tarefa/novo robô com um agente derivado especializado. Este novo agente depois praticou a nova tarefa em média dez mil vezes, gerando mais dados de treino, que, juntamente com os dados de demonstração, são inseridos no conjunto de dados de treino total. Uma nova versão do RoboCat é depois treinada com este conjunto mais completo, acelerando o processo.
O conceito foi aplicado com sucesso na preparação de braços robóticos em apenas poucas horas. O sistema foi rápido também a adaptar-se a mudanças no paradigma.
Veja aqui o processo de desenvolvimento e funcionamento deste robô: