Visão | Tem uma foto e um áudio? Novo programa de Inteligência Artificial capaz de criar "rostos falantes" realistas só com isso

Tem uma foto e um áudio? Novo programa de Inteligência Artificial capaz de criar “rostos falantes” realistas só com isso

Cada vez mais evoluída e cada mais assustador o que consegue fazer. A IA usada num novo programa é capaz de produzir vídeos 3D realistas das expressões faciais e movimentos de cabeça de uma pessoa a falar utilizando apenas um clip de áudio e uma fotografia

Inês Ferreira Lopes

Uma equipa de investigadores da Universidade de Tecnologia de Nanyang, em Singapura, desenvolveu um programa capaz de criar, “rostos falantes”, ou seja, vídeos 3D de uma pessoa com expressões faciais realistas e sincronizados com um clip de áudio. O programa, designado por DIRFA – e que em português significa “Diversas mas Realistas Animações Faciais” – é baseado em inteligência artificial e requer, apenas, uma fotografia e uma faixa áudio. “Especificamente, o DIRFA modelou a probabilidade de uma animação facial, como uma sobrancelha levantada ou um nariz enrugado, com base no áudio de entrada. Esta modelação permitiu ao programa transformar a entrada de áudio em sequências de animações faciais diversas, mas altamente realistas, para orientar a geração de rostos falantes”, explicou Lu Shijian, um dos autores envolvidos no estudo.

A equipa de investigadores quis criar “rostos falantes” que exibissem uma sincronização precisa entre os movimentos dos lábios, expressões faciais e movimentos naturais da cabeça ao áudio fornecido. Isto deve-se ao facto de o áudio ter, tipicamente, uma maior associação aos movimentos naturais dos lábios, mas pouca ligação às expressões faciais e posições da cabeça.

Através do Youtube, a equipa de investigadores publicou os resultados obtidos pelo novo programa

O DIRFA foi treinado utilizando mais de um milhão de clips audiovisuais de mais de 6 mil pessoas. Dados recolhidos de uma base informática de acesso aberto – The VoxCeleb2 Dataset – de forma a que o programa tivesse capacidade para prever pistas do discurso humano e conseguisse associá-las às diferentes expressões faciais e movimentos de cabeça. Uma novidade que distingue este programa de outros semelhantes por mostrar avanços relativamente aos métodos anteriores, incapazes de combinar as diferentes posições da cabeça e emoções faciais. “A fala apresenta uma multiplicidade de variações. Os indivíduos pronunciam as mesmas palavras de forma diferente em diversos contextos, englobando variações na duração, amplitude, tom e muito mais. Além disso, para além do seu conteúdo linguístico, o discurso transmite informações ricas sobre o estado emocional do orador e fatores de identidade como o sexo, a idade, a etnia e até traços de personalidade. A nossa abordagem representa um esforço pioneiro na melhoria do desempenho do ponto de vista da aprendizagem da representação áudio na IA e na aprendizagem automática”, referiu Wu Rongliang, um dos investigadores envolvidos no estudo.

Os especialistas esperam que o mecanismo do novo programa – publicado na revista científica Pattern Recognition – possa levar a novas aplicações em várias indústrias e áreas, incluindo à área de cuidados de saúde. Um possível exemplo da sua aplicação é o auxílio a pessoas com deficiências faciais ou na fala, uma vez que pode ajudá-las a transmitir os seus pensamentos e emoções através de representações digitais e, assim, melhorar a sua capacidade de comunicação. “O impacto do nosso estudo poderá ser profundo e de grande alcance, uma vez que revoluciona o domínio da comunicação multimédia ao permitir a criação de vídeos altamente realistas de pessoas a falar, combinando técnicas como a IA e a aprendizagem automática”, explicou Shijian.

Futuramente, os investigadores da Universidade de Nanyang pretendem aperfeiçoar as expressões faciais já existentes no programa do DIRFA, adicionando-lhe mais conjuntos de dados que incluam expressões faciais e clips de áudio de voz mais variados. “Experiências exaustivas mostram que o DIRFA pode gerar rostos falantes com movimentos labiais precisos, expressões faciais vivas e poses naturais da cabeça. No entanto, estamos a trabalhar para melhorar a interface do programa, permitindo que certos resultados sejam controlados. Por exemplo, o DIRFA não permite que os utilizadores ajustem uma determinada expressão, como mudar uma carranca para um sorriso”, esclareceu Rongliang.

Palavras-chave:

Sociedade

Tem uma foto e um áudio? Novo programa de Inteligência Artificial capaz de criar “rostos falantes” realistas só com isso

Sociedade

Palavras-chave:

CAPA DA EDIÇÃO

Edição 1672

Mais vistos

Os telemóveis que vão deixar de ter WhatsApp já em maio

As imagens impressionantes dos estragos provocados pela passagem da depressão Martinho por Portugal

A doce febre da tarte de queijo basca

Os europeus estão a deixar de comprar Teslas? Um gráfico que não deixa margem para dúvidas

Imagens de outra vida. Portugal há 5 anos, no primeiro confinamento da Covid-19

Satélites chineses praticaram manobras de combate espacial, alertam EUA

8 ideias grátis para celebrar o Dia Mundial da Poesia

MACAM abre portas com três dias de festa

Estas rendas não são para mães solteiras. A história dramática de Ana Paula, com quatro filhos e sem sítio para viver

O perigo por detrás do consumo de granizados pelos mais pequenos

Mais na Visão

Com Hamilton e Leclerc desqualificados, Ferrari garante que foram só erros de cálculo e não uma tentativa de ganhar vantagem

Arquivo VISÃO: O que diz a Ciência acerca do jejum intermitente – afinal, vale a pena fechar a boca ou nem por isso?

Dia de eleições regionais na Madeira: A última hipótese de Miguel Albuquerque

Papa teve alta hoje, após 37 dias de internamento

As datas das matrículas para o próximo ano letivo

120 anos de Júlio Verne: O escritor que "viu" o futuro

"Girls Will Be Girls", de Shuchi Talati: A nova luz do cinema indiano

26 ideias para combater o ressentimento

O perigo por detrás do consumo de granizados pelos mais pequenos

Estas rendas não são para mães solteiras. A história dramática de Ana Paula, com quatro filhos e sem sítio para viver

Descoberta revolucionária sobre a doença de Parkinson pode abrir caminho a novos tratamentos

VISÃO DO DIA: Netanyahu, o homem-bomba

TIN Brand Studio

Catarina Gouveia e o 'slow living': "A luz natural tem um grande impacto no meu dia"

Quer transformar a sua rotina de beleza? Participe e ganhe um kit exclusivo de cuidados de rosto e cabelo

A nova base leve como uma pena e que dura 30 horas

Tem uma foto e um áudio? Novo programa de Inteligência Artificial capaz de criar “rostos falantes” realistas só com isso

AnteVISÃO

Palavras-chave:

CAPA DA EDIÇÃO

Edição 1672

Mais vistos

Os telemóveis que vão deixar de ter WhatsApp já em maio

As imagens impressionantes dos estragos provocados pela passagem da depressão Martinho por Portugal

A doce febre da tarte de queijo basca

Os europeus estão a deixar de comprar Teslas? Um gráfico que não deixa margem para dúvidas

Imagens de outra vida. Portugal há 5 anos, no primeiro confinamento da Covid-19

Satélites chineses praticaram manobras de combate espacial, alertam EUA

8 ideias grátis para celebrar o Dia Mundial da Poesia

MACAM abre portas com três dias de festa

Estas rendas não são para mães solteiras. A história dramática de Ana Paula, com quatro filhos e sem sítio para viver

O perigo por detrás do consumo de granizados pelos mais pequenos

Mais na Visão

Com Hamilton e Leclerc desqualificados, Ferrari garante que foram só erros de cálculo e não uma tentativa de ganhar vantagem

Arquivo VISÃO: O que diz a Ciência acerca do jejum intermitente – afinal, vale a pena fechar a boca ou nem por isso?

Dia de eleições regionais na Madeira: A última hipótese de Miguel Albuquerque

Papa teve alta hoje, após 37 dias de internamento

As datas das matrículas para o próximo ano letivo

120 anos de Júlio Verne: O escritor que "viu" o futuro

"Girls Will Be Girls", de Shuchi Talati: A nova luz do cinema indiano

26 ideias para combater o ressentimento

O perigo por detrás do consumo de granizados pelos mais pequenos

Estas rendas não são para mães solteiras. A história dramática de Ana Paula, com quatro filhos e sem sítio para viver

Descoberta revolucionária sobre a doença de Parkinson pode abrir caminho a novos tratamentos

VISÃO DO DIA: Netanyahu, o homem-bomba

Mais Notícias

CARAS Decoração: a nova 'provocação' assinada pelo artista chinês Ai Weiwei

CARAS Decoração: em Vila Nova de Gaia, um apartamento transformado num refúgio de férias

Clima, risco, banca e crédito: o preço da (in)sustentabilidade

VOLT Live: Ionity vai abrir hubs em Albufeira e nas grandes cidades

Sonhar ilhas entre a ficção e a investigação científica

Nova peça de Tiago Rodrigues em Lisboa e Braga

A doce febre da tarte de queijo basca

Luís Montenegro: Tudo sobre o homem por detrás do político!

O grande final da novela turca “Querida Filha”: a vitória do amor e da esperança

Precisamos mesmo de suplementos depois dos 60 anos?

Hoje é Dia Mundial do Tiramisu: 6 receitas para testar e saborear

"Girls Will Be Girls", de Shuchi Talati: A nova luz do cinema indiano

Pigmentarium: perfumaria de nicho inspirada na herança cultural da República Checa

O original vestido de noiva de Inês Mendes da Silva

Clima: como o Alentejo Litoral se prepara para a “guerra”

26 consequências surpreendentes do aquecimento global

Vencedores e vencidos do 25 de Abril na VISÃO História

Gmail vai tirar partido de Inteligência Artificial nas pesquisas

Consumo de peixe ligado a um melhor desenvolvimento comportamental nas crianças

Os miúdos já votaram!

Os gadgets que vão marcar este ano

De Zeca Afonso a Adriano Correia de Oliveira. O papel da música de intervenção na revolução de 1974

Exame Informática TV nº 903: Smartphones, robôs e supercarros no MWC25

CARAS Decoração: Deco Out, novo evento de design de interiores em Lisboa

Saint Laurent encerra Semana da Moda de Paris com Bella Hadid

Citroën C3 conquista o título de Carro do Ano 2025 em edição marcada pela eletrificação

Um novo estúdio em Lisboa para jantares, showcookings, apresentações de marcas, todo decorado em português

10 sinais que provam que ele não esqueceu a “ex”

Água, por favor!

Em "A Promessa": Laura dá uma pista à família sobre a sua localização

Carregar 2 km de autonomia por segundo: conheça a tecnologia da BYD

Os paradoxos do mercado de trabalho português

Ode ao Vinhão: Pode uma das castas mais controversas do País dar origem a vinhos de qualidade?

Luís Buchinho celebra 35 anos de carreira com coleção inovadora

Quis Saber Quem Sou: Será que "ainda somos os mesmos e vivemos como os nossos pais?"

Correntes d'Escritas - Um ano para pintar a manta

Demi Moore e as filhas celebram aniversário de Bruce Willis

CARAS Decoração: novidades de exterior que convidam à vida ao ar livre

VISÃO Se7e: Ouriços, poemas e um museu novo para descobrir

Um século de propaganda na VISÃO História

Luís Carvalho: a nova era do "Office Workwear"

Descoberta revolucionária sobre a doença de Parkinson pode abrir caminho a novos tratamentos

Teste: conheces o teu planeta?

Estes sinais indicam que tem tensão sexual com alguém

Nova teoria: ‘Micro-raios’ entre gotas de água podem ter originado vida na Terra

TIN Brand Studio

Catarina Gouveia e o 'slow living': "A luz natural tem um grande impacto no meu dia"

Quer transformar a sua rotina de beleza? Participe e ganhe um kit exclusivo de cuidados de rosto e cabelo

A nova base leve como uma pena e que dura 30 horas