aCSM-all como validação de complexos de proteínas gerados pelo AlphaFold

Taís Christofani

O problema do enovelamento de proteínas e um dos grandes desafios em aberto da biologia e consiste em determinar a estrutura molecular de uma proteína com base apenas na sua sequencia genética. Essa determinação e extremamente importante, já que a função biológica de uma proteína esta intrinsecamente ligada a sua estrutura. Em 2018, surgiu a inteligência artificial AlphaFold para a previsão de estruturas de proteínas, obtendo resultados tão bom que passou a ser amplamente utilizada pela comunidade científica. Ao que diz respeito a interação de proteínas, o AlphaFold ainda enfrenta desafios e é difícil dizer que complexos proteicos modelados por ele possuem de fato função biológica. Assim, o presente trabalho se propôs a criar um classificador para estruturas de complexos geradas pelo AlphaFold para identificar as estruturas como nativas ou não. Utilizando as assinaturas de grafos biológicos geradas pelo metodo aCSM-all como função alvo de diferentes técnicas de aprendizado de máquina, foi obtido um parâmetro AUC de 0,610 com o algoritmo kNN, um pouco melhor que um classificador aleatório. Mais estudos serão necessários para dizer se as assinaturas servem como parâmetro para a classificação em questão ou não.


2023/2 - POC1

Orientador: Raquel C. de Melo-Minardi

Palavras-chave: machine learning, ascm-all, protein-protein interaction

Link para vídeo

PDF Disponível