A imagiologia de lâmina inteira, uma das tecnologias mais associadas à patologia digital, desempenha um papel importante no campo da oncologia. Através dela é possível captar imagens digitais de alta resolução de lâminas de microscópio que contêm, por exemplo, uma amostra do tecido de um tumor.
Estas imagens têm informação que é fundamental para certos tipos de tratamento do cancro. No entanto, existem desafios complexos, relacionados com a dimensão das imagens digitais, na ordem dos gigapixeis, que podem levar à perda de dados relevantes.
A resposta para estes desafios na patologia digital pode estar num novo modelo fundacional, chamado Prov-GigaPath. Apresentado num recém-publicado estudo na revista científica Nature, o modelo é um esforço conjunto entre cientistas da Universidade de Washington, a Microsoft e a Providence, uma rede de serviços de saúde norte-americana que tem 28 centros oncológicos.
O modelo foi pré-treinado com 1,3 mil milhões de imagens de patologia, que tiveram origem em 171.189 imagens de lâmina inteira fornecidas pela Providence. Até à data, o Prov-GigaPath afirma-se como o primeiro modelo fundacional da sua espécie a ser pré-treinado em larga escala com dados reais, vindos de mais de 30.000 pacientes.
Na base do modelo está a GigaPath, uma arquitetura de deep learning para visão computacional concebida para o processo de pré-treino com os múltiplos segmentos de imagem que compõem as imagens de lâmina inteira. Para tal, a GigaPath adapta o método LongNet, desenvolvido pela Microsoft, à área da patologia digital.
Nos testes realizados, o Prov-GigaPath demonstrou um elevado nível de desempenho em 25 das 26 tarefas de patologia digital. O estudo realça também uma melhoria significativa em comparação com o segundo melhor modelo em 18 tarefas.
O Prov-GigaPath, que passa a estar disponível a nível global, promete abrir a porta a novas abordagens no estudo de tumores, com potencial para aplicações na área de diagnóstico do cancro, mas também no tratamento.
Os investigadores concluem que, embora os primeiros resultados sejam promissores, há ainda muito trabalho pela frente, mas também oportunidades para levar o modelo desenvolvido ainda mais longe.