Novo estudo sobre a compreensão do funcionamento das proteínas através da inteligência artificial
Cientistas afiliados à Freie Universität Berlin contribuem para o avanço da Microsoft Research na modelação de proteínas
Um grande avanço científico na modelação de proteínas, desenvolvido pela Microsoft Research AI for Science, foi publicado na edição de 10 de julho da Science. O estudo apresenta o BioEmu, um sistema generativo de aprendizagem profunda que emula o comportamento de equilíbrio das proteínas com uma velocidade e precisão sem precedentes.
Uma vez que a função biológica das proteínas depende de alterações dinâmicas na sua estrutura, a capacidade de prever estas alterações estruturais de forma rápida e precisa abre a porta a decisões de conceção mais racionais na descoberta de medicamentos, ajudando a reduzir a taxa de insucesso dos medicamentos nos ensaios clínicos.
O BioEmu pode gerar milhares de estruturas proteicas estatisticamente independentes por hora numa única unidade de processamento gráfico (GPU). "Isto reduz o custo e o tempo necessário para analisar as alterações da estrutura funcional das proteínas", afirma o Professor Frank Noé, que liderou o projeto. O BioEmu integra mais de 200 milissegundos de simulações de dinâmica molecular com dados experimentais para prever conjuntos estruturais e propriedades termodinâmicas com uma precisão quase experimental.
O sistema capta fenómenos biológicos complexos, como a formação de bolsas de ligação ocultas, movimentos de domínio e desdobramento local - todos eles essenciais para compreender a função das proteínas e a conceção de medicamentos. O BioEmu também prevê alterações na estabilidade das proteínas com uma exatidão que pode competir com as experiências laboratoriais. "Assim, o BioEmu fornece um método escalável para modelar a função das proteínas à escala genómica", acrescenta a Professora Cecilia Clementi.
O código e o modelo do BioEmu estão disponíveis gratuitamente ao abrigo da licença permissiva do MIT. Juntamente com a publicação, a Microsoft Research também divulgou o conjunto de dados de simulação de dinâmica molecular que foi gerado para treinar o BioEmu. Este conjunto de dados - que inclui mais de 100 milissegundos de simulações em milhares de sistemas proteicos - representa o maior conjunto de simulações de proteínas com diversidade de sequências disponível publicamente até à data.
Embora a investigação tenha sido realizada inteiramente na Microsoft, a Freie Universität Berlin orgulha-se de reconhecer as contribuições dos investigadores afiliados. A investigação foi liderada por Frank Noé, Partner Research Manager na Microsoft Research AI for Science em Berlim, que também é professor honorário na Freie Universität Berlin. Cecilia Clementi, Professora Einstein de Biofísica Teórica e Computacional na Freie Universität Berlin, deu contributos fundamentais para o trabalho enquanto investigadora visitante na Microsoft Research.
Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Inglês pode ser encontrado aqui.
Publicação original
Sarah Lewis, Tim Hempel, José Jiménez-Luna, Michael Gastegger, Yu Xie, Andrew Y. K. Foong, Victor García Satorras, Osama Abdin, Bastiaan S. Veeling, Iryna Zaporozhets, ... Hannes Schulz, Usman Munir, Roberto Sordillo, Ryota Tomioka, Cecilia Clementi, Frank Noé; "Scalable emulation of protein equilibrium ensembles with generative deep learning"; Science, 2025-7-10