A ideia é promover uma “capa” para o vídeo final. Esta é produzida automaticamente, recorrendo a quase todos os sensores disponíveis, e apresentada ao utilizador, para que o vídeo possa ser visto por um maior número de espetadores.
A cover frame, neste momento, é sugerida de entre 15 frames que o Video deteta. A predefinição faz com que apareça sempre o primeiro frame detetado, explica o TechCrunch. Agora, com a aplicação destas patentes, o Facebook e o Instagram vão poder escolher os momentos mais interessantes e sugerir os tags necessários e o que mais usar para tornar o vídeo mais apelativo.
As patentes em questão foram registadas em outubro de 2011, mas aprovadas apenas em abril de 2013. A tecnologia que o Facebook detém permite olhar para cada frame de vídeo como se fosse uma fotografia. Os algoritmos criados permitem então identificar automaticamente utilizadores, palavras, locais de interesse e marcas. Este tipo de informações poderá aparecer especificamente em cada vídeo, ou ser associada apenas como metadado. Nesta última situação, os vídeos sobre um determinado monumento poderiam ser apresentado aos utilizadores que já tivessem referido gostar daquele local. O sistema de tagging pode tornar-se bastante mais complexo do que é atualmente, mas com estas tecnologias grande parte da complexidade pode ser automatizada.
Por último, foi também patenteada a tecnologia que permite ao Instagram ouvir o que está a ser dito em cada vídeo e captar o momento mais interessante e apresenta-lo como cover frame. Por exemplo, quando alguém grita “Golo” durante um vídeo, os algoritmos de deteção de discurso podem funcionar a apanhar o momento anterior, quando o jogador remata a bola.
A ideia por trás destas patentes é que os tags em vídeo passem a funcionar como o reconhecimento que é feito nas fotografias.