No início de maio, a Comissão Europeia detetou diariamente mais de 2700 artigos que continham fake news relacionadas com a Covid-19. Para combater aquela que já está a ser apelidada como uma das ‘doenças do século’, a desinformação, um grupo de investigadores propõe uma forma automática de ajudar o utilizador comum e os jornalistas a identificarem a informação com maior probabilidade de ser falsa e a filtrar o conteúdo mais relevante. O projeto ‘Detecting Fake News Automatically’, que está a ser desenvolvido no INESC-TEC, extrai várias informações da publicação que considera relevantes e tem capacidade para analisar mais de 100 indicadores, entre os quais psicolinguísticos (qual a emoção mais predominante no texto, por exemplo) ou estatísticos (frequência de verbos, adjetivos ou entidades, entre outros). Esse conjunto de dados é sujeito depois à análise de um modelo de aprendizagem automática, que aprendeu a fazer a distinção com casos previamente conhecidos e que já tinham sido classificados como fake news. “Com base nessa aprendizagem, o modelo classificará com uma certa probabilidade a nova publicação como sendo ou não fake news”, explica Álvaro Figueira, investigador INESC TEC e professor no Departamento de Ciência de Computadores da Faculdade de Ciências da Universidade do Porto (FCUP), em comunicado.
Além da mensagem escrita, é analisada também toda a informação associada, como os likes, as partilhas, os comentários ou a informação sobre o utilizador que fez a publicação.
O sistema pressupõe a utilização de várias técnicas e métodos, como data mining, aprendizagem automática, processamento de linguagem natural, reconhecimento de entidades mencionadas, análise de sentimento, entre outros.
O projeto surge ligado ao projeto REMINDS, no qual se pretendeu construir um sistema capaz de detetar as publicações nas redes sociais mais relevantes para o público após as eleições norte-americanas de 2016, numa altura em que o problema das fake news ganhou uma maior dimensão. No contexto de pandemia atual, há variáveis que mudam e foi necessário adaptar o sistema aos novos desafios.
“A pandemia por Covid-19, tendo um domínio e contexto específicos, tem sido um caso de estudo muito interessante no universo das fake news. É a nossa opinião que o sistema será capaz de adaptar-se e detetar fake news em qualquer domínio, contribuindo para mitigação deste tipo de conteúdos nas redes sociais”, conclui Álvaro Figueira.