Os investigadores da Microsoft deram o exemplo de pedir a um computador que desenhasse um «pássaro amarelo com asas pretas e um pequeno bico» e o resultado é o que está na imagem que acompanha este artigo. O sistema gera imagens a partir de descrições de texto e consegue fazê-lo com bastante precisão.
Xiadong He, um dos investigadores, explica que o desenho é criado pelo computador, pixel a pixel, de raiz. «Estes pássaros podem não existir no mundo real – são um aspeto da imaginação dos nossos computadores», cita o Engadget. O objetivo é criar um sistema que assista pintores ou designers e até uma forma de criar filmes animados a partir de um guião escrito.
A equipa utiliza uma Generative Adversarial Network, ou GAN, que gera as imagens e uma outra ferramenta que avalia a qualidade das imagens geradas. O sistema trabalha em pares de imagens e legendas, o que ensina a IA a perceber quais as imagens certas para cada texto ou palavra. Por outro lado, a equipa criou ainda uma representação matemática do que é a atenção humana, de forma a que o computador possa prestar atenção aos pormenores em descrições complexas e desenhá-los todos.