Exame Informática | OpenAI ‘trava’ capacidades de reconhecimento de imagens do GPT-4

OpenAI ‘trava’ capacidades de reconhecimento de imagens do GPT-4

Getty Images

Receios com a privacidade levam a OpenAI a travar o lançamento de uma funcionalidade do GPT-4 relacionada com a análise de caras por parte do sistema de IA

Exame Informática

A OpenAI prossegue testes e desenvolvimentos de novas funcionalidades para o GPT-4, o modelo que atualmente está na base da versão mais avançada do ChatGPT, nomeadamente no que toca ao reconhecimento de imagens. Agora, sabe-se que a empresa está a travar a disponibilização pública de uma ferramenta particular, que consegue fazer o reconhecimento de imagem e reconhecer automaticamente alguns indivíduos.

O GPT-4 é a iteração da OpenAI no que toca a modelos de Inteligência Artificial multimodais, ou seja, capazes de processar e gerar texto, mas também de analisar e interpretar imagens. Algumas funcionalidades relacionadas com processamento de imagem estão a ser desenvolvidas e experimentadas em parceria com a Be My Eyes, uma startup que quer desenvolver uma app para utilizadores invisuais conseguirem interpretar melhor o que os rodeia e interagir com o meio envolvente de forma independente.

O ‘travão’ no reconhecimento de rostos foi revelado por Jonathan Mosen, um utilizador invisual da app que está a testá-la no seu quotidiano. Sandhini Agarwal, da OpenAI, confirma que o receio com a privacidade está a condicionar a estratégia da empresa, que prefere não arriscar violar a lei de algumas regiões, onde o uso de informação biométrica carece de autorização prévia.

O GPT-4 consegue reconhecer atualmente figuras públicas, com base em imagens públicas, como as que estão disponíveis na Wikipedia, lembra o ArsTechnica.

Além da privacidade, a OpenAI está também preocupada com potenciais falhas de interpretação do rosto ou de traços como género ou estado emocional que possa conduzir depois a resultados perigosos. Agarwal afirma que “queremos muito esta conversa bidirecional com o público. Se o que ouvirmos for ‘Não queremos nada disso’, estamos prontos para isso também”.

Recorde-se que a Microsoft, investidora na OpenAI, está a trabalhar em ferramentas de análise visual para o chatbot do Bing e a Google também está a introduzir ferramentas idênticas para o Bard.