Uma equipa de investigadores das Universidades de Yale e Nacional de Singapura desenvolveu uma nova abordagem que permite melhorar a qualidade dos dados obtidos através de câmaras, conduzindo a um reconhecimento facial e de objetos mais preciso. A tecnologia de visão de máquina, em combinação com soluções de Inteligência Artificial, tem uma utilização cada vez mais frequente, desde sistemas de vigilância, condução autónoma, reconhecimento facial e manutenção de distanciamento social. Assim, torna-se cada vez mais necessário que as imagens obtidas e que servem de base forneçam a maior quantidade possível de dados. As novas técnicas permitem extrair melhores dados a partir de imagens, mesmo que tenham um baixo nível de visibilidade, quando captadas à noite ou está a chover, por exemplo.
Imagens captadas à noite são afetadas pela baixa quantidade de luz, enquanto as que são captadas em condições atmosféricas adversas ostentam brilhos ou outros efeitos que prejudicam a capacidade de reconhecimento.
A abordagem da equipa liderada pelo professor Robby Tan pretende mitigar precisamente essas deficiências, lembrando que “por exemplo, os carros autónomos não conseguem operar de forma robusta em condições de muita chuva e os sistemas de CCTV falham muitas vezes à noite, quando o cenário é escuro ou há brilho consistente”. Os investigadores usaram algoritmos de aprendizagem profunda para melhorar a qualidade destas imagens, reduzindo o ruído e os efeitos negativos para gerar filmagens mais claras. Num segundo estudo, foi introduzido um método de alinhamento dos frames que permitiu obter melhor qualidade visual, mesmo em cenários com precipitação elevada. Esta técnica consiste também em estimativas para remover o efeito da queda da chuva e permitir um reconhecimento mais preciso, noticia o EurekAlert.
A terceira novidade apresentada durante a CVPR (Conference on Computer Vision and Pattern Recognition) passa por melhorar as capacidades de estimativa 3D das poses de humanos em cenários com muitas pessoas, útil para vigilância de multidões, por exemplo. A técnica permite antecipar melhor qual vai ser a pose de um determinado indivíduo, no meio de outras pessoas, conduzindo a um reconhecimento de atividade mais fiável. A técnica passa por uma combinação de dois métodos já existentes e produz resultados de maior confiança, tendo em consideração diversos parâmetros.
“O próximo passo na investigação de estimativa de pose 3D passa por procurar as melhores formas de proteger a informação privada nos vídeos. Para os métodos de melhoria de visibilidade, pretendemos continuar a contribuir para avanços no campo da visão de computador, que é crítico para tantas aplicações que vão afetar o nosso quotidiano, como os carros autónomos”, explicou Tan.