Há muito que pesquisar informação online não implica, necessariamente, abrir uma página web e escrever algumas palavras num motor de busca. Já é possível fazer pesquisas através de assistentes de voz, diretamente num mapa ou tirando uma simples fotografia. A Google ‘arrepiou’ caminho na indústria em muitas destas áreas e diz estar empenhada em continuar a evoluir nestes segmentos – inclusive numa altura em que está a ser pressionada por um novo sistema de geração e pesquisa de informação, o ChatGPT da OpenAI.
“A pesquisa é o nosso projeto mais ambicioso [moonshot no original em inglês]. Porque a tecnologia de pesquisa online está em mudança constante”, defendeu Prabhakar Raghavan, líder de sistemas de pesquisa da Google, num evento realizado nesta quarta-feira em Paris, França, e no qual a Exame Informática marcou presença.
Uma das áreas na qual a Google mais tem investido é na chamada pesquisa visual – ou seja, fazer pesquisa através de fotografias ou imagens captadas em tempo real do ambiente que nos rodeia. A aplicação de pesquisa visual Google Lens tem continuado a crescer – se em setembro do ano passado eram feitas oito mil milhões de pesquisas através deste método, agora já são feitas 10 mil milhões, de acordo com dados revelados pela empresa. Um incremento que se deve, em muito, à integração do Google Lens diretamente na caixa de pesquisa do motor de busca Google.
Apesar de já ter dado a conhecer a funcionalidade no ano passado, a Google anunciou agora que a pesquisa multimodal do Google Lens – um sistema que permite combinar pesquisa visual e pesquisa por texto – passa a estar disponível para utilizadores de todo o mundo.
A atualização da aplicação deverá ficar disponível, de forma faseada, ao longo das próximas semanas, e vai suportar 70 idiomas. Com a pesquisa multimodal, podemos, por exemplo, tirar uma fotografia a um caderno e depois escrever, em texto, para que o Google encontre uma camisa com um padrão semelhante.
A Google anunciou ainda a integração da geolocalização na pesquisa multimodal. Exemplo: com o smartphone pode tirar uma fotografia de um bolo (como um pastel de natal) e depois escrever na pesquisa “perto de mim”, para que o Google lhe recomende locais, perto de si, onde pode comer aquele bolo específico.
“Com o Lens, se conseguires ver, consegues pesquisar”, disse Elizabeth Reid, vice-presidente de engenharia da tecnológica americana, sobre estas funcionalidades. “A câmara é o próximo teclado”, tinha defendido já antes Prabhakar Raghavan, sobre os avanços que a empresa tem feito nesta aplicação.
A Google anunciou ainda outra forma de pesquisa visual – vai ser possível pesquisar aquilo que estamos a ver num vídeo. Para isso, basta ativar o Assistente Google enquanto o vídeo está a ser reproduzido, para o sistema tentar identificar o que está na imagem naquele momento específico.
Maps com novidades
Além do Google Lens, também o Google Maps recebeu funcionalidades que têm por base mecanismos de Inteligência Artificial. O destaque vai para o modo imersivo, que combina fotografias do Google Street View e fotografias áreas para gerar imagens 3D de monumentos em diferentes cidades do mundo (por agora, o número de monumentos ainda é limitado).
Outra novidade é o lançamento da visualização imersiva de espaços públicos, como restaurantes – na prática, permite-nos saber como é o espaço interior dos espaços através de uma visita virtual. Mas a maior novidade está na forma como a Google consegue atingir estes resultados – em vez de usar um sistema com várias câmaras para recriar um ambiente em 360 graus, a tecnológica só precisa de fotografias comuns, captadas por smartphone ou uma câmara de fotografia dedicada.
Depois, recorrendo a uma técnica conhecida como neural radiance fields, que usa redes neuronais para identificar pontos em comum entre as fotografias e calcular a exata aproximada entre eles, é possível criar uma representação 3D de alta fidelidade do interior de um espaço público. Por agora, este sistema está a ser testado com parceiros selecionados, mas o objetivo é que possa vir a ser disponibilizado no futuro a mais donos de espaços de restauração e outros espaços de atendimento ao público.
Além destes anúncios, no evento em Paris, a Google revelou mais alguns detalhes sobre o Bard, o sistema de IA conversacional que a empresa está a desenvolver.