Identificar os compostos químicos através da experimentação bioquímica é fundamental para compreender a fisiologia das doenças, estabelecer novas abordagens terapêuticas e perceber a composição molecular de certos materiais, como as garrafas de plástico. Neste caso em concreto, o ovo de Colombo seria perceber a composição molecular das garrafas, que são o segundo tipo mais comum de poluição por plástico, a seguir aos sacos, provocando um impacto severo sobre a vida selvagem e a biodiversidade.
Em conjunto com outros cientistas, o biólogo John McGeehan, do Centro de Inovação de Enzimas da Universidade de Portsmouth, tem feito avanços importantes, na sua busca por moléculas que consigam “digerir” o plástico.
No laboratório de inteligência artificial em Londres DeepMind, McGeehan desenvolveu um procedimento que prevê instantaneamente os desenhos de enzimas e outras proteínas. Antigamente, apenas se conseguia aceder a esta informação com acesso a Raio X, microscópios e outros meios laboratoriais. Agora, de acordo com McGeehan, usa-se o Alphafold – um programa de inteligência artificial desenvolvido pela DeepMind do Google que realiza previsões da estrutura da proteína e permite diminuir o tempo de investigação.
Neste programa de inovação tecnológica, são estudadas as estruturas proteicas, utilizando o que é referido como uma rede neural de proteínas identificadas e as suas formas físicas. Além disso, é 63% mais rápido que os outros métodos na caracterização proteica.
No entanto, a precisão do sistema varia, pelo que algumas das precisões na base de dados do DeepMind podem ser muito menores. Os investigadores do laboratório estimam que o processo forneça uma previsão “boa” de cerca de 95%, fazendo com que o procedimento não possa mudar totalmente as experiências físicas.
Através do AlphaFold, alguns cientistas da Universidade do Colorado, em Boulder, conseguiram encontrar uma estrutura proteica que já vinham a tentar descobrir há mais de 10 anos.
Já comparada por alguns cientistas ao Human Genome Project (HGP) – programa internacional de pesquisa colaborativa cujo objetivo é o mapeamento completo e a compreensão de todos os genes dos seres humanos –, a nova base de dados do DeepMind concebeu um mapa com as cerca de 20 mil proteínas do genoma humano, bem como com proteínas existentes em 20 outros organismos, que incluem o rato, a mosca da fruta e a bactéria E. coli – bactéria bacilar que se encontra normalmente no trato gastrointestinal inferior dos organismos de sangue quente.
Num laboratório da Universidade de Washington foi já criado um processo muito semelhante, denominado de RoseTTAFold – projeto de computação criado para prever a estrutura de proteínas na plataforma Berkeley Open Infrastructure for Network Computing (BOINC).
Alguns cientistas já se estão a basear na AlphaFold, da Universidade do Colorado, para compreender como a E. coli e a salmonela (bactéria que pode ser transmitida através do consumo de alimentos contaminados com fezes de animais) produzem resistência aos antibióticos, e para construir formas de combater esta resistência; na Universidade da Califórnia, São Francisco, têm utilizado o software para melhorar o seu conhecimento sobre o coronavírus.
A importância de estudar a composição molecular de bactérias, vírus e proteínas no organismo humano também se reflete na situação pandémica atual em que se encontra o mundo. Com a ajuda da AlphaFold, os cientistas estão agora compreender melhor a proteína vital e conseguiram chegar à composição do novo coronavírus – que destrói corpo humano através de 26 proteínas distintas. De acordo com Kliment Verba, um dos investigadores em São Francisco, citado pelo The New York Times, caso isto chegue demasiado tarde para ter um efeito sobre a pandemia existente, pode, pelo menos, apoiar na preparação para uma possível pandemia futura.