A Nvidia anunciou uma nova plataforma para a criação de agentes virtuais chamada Omniverse Avatar. Esta combina tecnologias como o reconhecimento de voz, a síntese de fala, o reconhecimento facial e a animação 3D que, segundo a empresa, alimentam uma variedade de agentes virtuais.
Na GTC, conferência anual da empresa, o diretor executivo (CEO) Jensen Huang apresentou algumas demonstrações a utilizar a tecnologia Omniverse Avatar. Na primeira, uma personagem num quiosque digital fala com um casal através do menu de um restaurante de fast food, respondendo a perguntas como quais são as opções vegetarianas. A personagem utiliza a tecnologia de reconhecimento facial para manter contacto visual com os clientes e responder às suas expressões faciais, o que Huang afirma vir a ser “útil para a venda inteligente, drive-throughs e atendimento ao cliente”. Na segunda demonstração, uma versão animada do CEO – que pode ver na imagem acima – respondeu a perguntas sobre tópicos como a mudança climática e a produção de proteína.
Ainda numa terceira demo, alguém usou um avatar animado real de si próprio para o substituir durante uma videochamada. Enquanto a pessoa que ligou estava vestida casualmente e num café movimentado, o seu avatar virtual estava bem vestido e falava sem ruído de fundo. Este exemplo baseia-se no trabalho do Projeto Maxine da Nvidia, que visa melhorar problemas comuns em videochamadas, como transmissões de baixa qualidade ou manter o contacto visual, com o auxílio de software.
O “omniverso” consiste, tal como o “metaverso”, em mundos virtuais compartilhados que permitem colaboração remota. Comparado com a visão apresentada pelo Facebook, a Nvidia está mais preocupada em replicar ambientes industriais com contrapartes virtuais e em criar avatares que interajam com o mundo físico, do que em transportar as reuniões de escritório para a realidade virtual.
Embora as demos da Nvidia parecessem muito interessantes, não é claro o quão útil esta tecnologia será no mundo real. Por exemplo, com o personagem do quiosque não é claro se os clientes irão preferir realmente esta experiência interativa a simplesmente selecionar as opções que querem do menu. Além disso, Huang observou, durante a apresentação, que o avatar tem um tempo de resposta de dois segundos, sendo mais lento do que um humano e podendo causar frustrações se os clientes estiverem com pressa. O mesmo acontece com a tecnologia do Projeto Maxine que, embora, aparentemente avançada, ainda não mostrou impacto no mundo real.