A Nvidia anunciou ter desenvolvido uma técnica para conversão de imagens 2D para 3D de forma bastante rápida. A solução consiste no treino de algoritmos que passam a precisar apenas de poucos segundos para gerar uma cena tridimensional, com base em simples imagem 2D. A NeRF apresenta a capacidade de ‘preencher o espaço em branco’, adivinhando e prevendo o que não está presente e interpolando elementos que a fotografia 2D não tenha captado. O avanço permite desbloquear soluções em vários campos, nomeadamente na condução autónoma e no desenvolvimento de videojogos.
O Instant NeRF parte de várias imagens e fotos captadas de diferentes ângulos para gerar depois uma convincente cena ou objeto 3D em algumas “dezenas de milissegundos”, descreve a Nvidia. Segundo o Engadget, as imagens que tenham múltiplos objetos ou personagens devem ser o mais estáveis possível, para evitar que o resultado final seja desfocado.
A Nvidia explica que os modelos anteriores de NeRF demoravam alguns minutos a produzir resultados, mas que precisavam de treinos durante várias horas. Com o Instant NeRF, o tempo de treino é reduzido para alguns segundos, tirando partido de uma codificação multi-resolução, otimizada para correr de forma eficiente nas GPUs da Nvidia. O sistema funciona de forma mais rápida em placas gráficas com núcleos tensor, mas pode ser usado apenas com uma única GPU se for preciso.
A Instant NeRF pode vir a ser utilizada para treinar robôs e ajudar sistemas de condução autónoma a identificar formas e objetos.