Desenvolvido por um vasto grupo de investigadores, o Genesis é um novo motor de física para treino de robôs que recorre a Inteligência Artificial. De acordo com a equipa, este motor de código aberto permite treinar robôs, colocando-os a praticar tarefas em realidade simulada, 430 mil vezes mais rápido do que em tempo real.
O Genesis é ‘alimentado’ por um motor de física universar que foi redesenhado e reconstruído de raiz pelos investigadores, integrando vários componentes sob um único enquadramento. Num nível superior, o motor é melhorado por um agente generativo que procura automatizar a geração de dados e modalidades múltiplas.
O sistema, leve, rápido e fácil de integrar em plataformas de treino é constituído por uma poderosa e fotorrealista ferramenta de renderização. Nesta fase, a equipa está a disponibilizar o acesso à plataforma subjacente do motor de Física e à plataforma de simulação, com o acesso ao quadro generativo a ser disponibilizado mais tarde, noticia o Interesting Engineering. Este quadro integra vídeos, movimentos de câmara e parâmetros, movimento de personagens humanas e animais, manipulação robótica e política de movimentação, cenas 3D interativas, reconhecimento de discurso, animação facial e emoções.
Com a computação paralela potenciada pela GPU, o modelo tira partido de funcionalidades como auto-hibernação, ilhas de contactos, deteção otimizada de colisões e muito mais, o que lhe permite correr simulações a 43 milhões de FPS, o que é 430 mil vezes mais rápido do que a realidade.
Os investigadores explicam que usam um agente gerado por um Modelo Muito Grande (VLM, na sigla em inglês) que usa as APIs fornecidas pela infraestrutura de simulação como ferramentas para criar mundos 4D dinâmicos que podem ser usados para fonte de dados fundacional para extrair várias modalidades de dados.
Zhou Xian, que faz parte da equipa que desenvolveu a ferramenta, conta que “o motor de Física Genesis é desenvolvido em Python puro, sendo 10 a 80x mais rápido do que as congéneres aceleradas por GPU como Isaac Gym ou MJX. Consegue entregar velocidades de simulação cerca de 430 mil vezes mais rápido do que o tempo real e só precisa de 26 segundos para treinar uma política de locomoção robótica transferível para o mundo real numa única RTX4090”.