O objetivo da equipa era encontrar uma forma de alimentar estes modelos com imagens e com o mínimo de supervisão humana possível. A solução passa por usa milhares de milhões de imagens públicas do Instagram e que já têm uma espécie de classificação, com as hashtags. O sistema, segundo o The Verge, “viu” 3,5 mil milhões de imagens com 17 mil hashtags. Depois de uma primeira fase, com mil milhões de imagens, o algoritmo conseguiu uma precisão de 85,4% no teste de reconhecimento de imagens ImageNet, batendo o recorde anterior que se cifrava nos 83,1%.
Com este avanço, o Facebook mostra que um método com pouca supervisão humana também pode ser eficaz e preciso no reconhecimento. Este tipo de soluções pode ser usado para gerar legendas áudio de fotografias para pessoas com deficiências visuais ou mesmo melhorar a forma como a Inteligência Artificial do Facebook está atualmente a reconhecer e identificar imagens e vídeos.
Os responsáveis do Facebook explicam que à medida que o volume de dados aumenta, é vital desenvolver modelos com pouca, ou mesmo nenhuma, supervisão humana.