Já há alguns anos que existem aplicações experimentais que usam reconhecimento de voz para traduzir em tempo real o que dizemos. O sistema da Microsoft, chamado Monolingual TTS, pega nessa ideia e dá um passo em frente, recriando a voz do próprio utilizador para ser usada na tradução em vez de um sintetizador de voz genérico.
De acordo com a PC World, tal como outros tradutores o software permite-nos falar na nossa língua nativa fazendo, de seguida, a tradução. O que sai do altifalante não é, todavia, o tom monocórdico e robótico comum nos sistemas text-to-speech, mas uma aproximação da nossa própria voz. Para atingir este fim, o software precisa de ser treinado durante cerca de uma hora para conseguir produzir os sons necessários à duplicação da voz do utilizador.
A aplicação é também capaz de criar uma imagem tridimensional da nossa cabeça e faz com que pareça que estamos a falar na língua estrangeira.
A visão da Microsoft para o futuro compreende avatares realistas que nos imitam produzem sons semelhantes à nossa voz, movendo os lábios virtuais em perfeita sincronia com a língua estrangeira em que estão a falar, apesar de não ter especificado qualquer data para a comercialização desta tecnologia.