O trabalho pressupõe que um espião, por exemplo, não precisa de estar a ouvir o seu alvo para o conseguir escutar. O processo consegue analisar as vibrações que o discurso de alguém provoca em objetos próximos, como num copo de água ou em folha de alumínio.
Os investigadores conseugram identificar vibrações únicas que os diferentes sons fazem, através da análise de vídeos com um frame rate elevado captados dentro de uma sala especial. Se o frame rate da câmara fosse superior fosse superior à frequência do sinal áudio, os investigadores conseguiam melhores resultados.
As ondas sonoras não podem ser vistas a olho nu, mas em vídeo analisado por um computador é possível detetar o movimento. Numa das experiências, o som captado estava tão nítido que a app Shazam conseguiu identificar a música tocada.
Veja o vídeo que explica todo o processo.