A OpenAI prossegue testes e desenvolvimentos de novas funcionalidades para o GPT-4, o modelo que atualmente está na base da versão mais avançada do ChatGPT, nomeadamente no que toca ao reconhecimento de imagens. Agora, sabe-se que a empresa está a travar a disponibilização pública de uma ferramenta particular, que consegue fazer o reconhecimento de imagem e reconhecer automaticamente alguns indivíduos.
O GPT-4 é a iteração da OpenAI no que toca a modelos de Inteligência Artificial multimodais, ou seja, capazes de processar e gerar texto, mas também de analisar e interpretar imagens. Algumas funcionalidades relacionadas com processamento de imagem estão a ser desenvolvidas e experimentadas em parceria com a Be My Eyes, uma startup que quer desenvolver uma app para utilizadores invisuais conseguirem interpretar melhor o que os rodeia e interagir com o meio envolvente de forma independente.
O ‘travão’ no reconhecimento de rostos foi revelado por Jonathan Mosen, um utilizador invisual da app que está a testá-la no seu quotidiano. Sandhini Agarwal, da OpenAI, confirma que o receio com a privacidade está a condicionar a estratégia da empresa, que prefere não arriscar violar a lei de algumas regiões, onde o uso de informação biométrica carece de autorização prévia.
O GPT-4 consegue reconhecer atualmente figuras públicas, com base em imagens públicas, como as que estão disponíveis na Wikipedia, lembra o ArsTechnica.
Além da privacidade, a OpenAI está também preocupada com potenciais falhas de interpretação do rosto ou de traços como género ou estado emocional que possa conduzir depois a resultados perigosos. Agarwal afirma que “queremos muito esta conversa bidirecional com o público. Se o que ouvirmos for ‘Não queremos nada disso’, estamos prontos para isso também”.
Recorde-se que a Microsoft, investidora na OpenAI, está a trabalhar em ferramentas de análise visual para o chatbot do Bing e a Google também está a introduzir ferramentas idênticas para o Bard.