Simulação de grandes biomoléculas com precisão quântica

O novo modelo de IA ultrapassa os limites em termos de universalidade, eficiência, exatidão e escalabilidade

03.09.2025
AI-generated image

Imagem do símbolo

Uma equipa internacional de investigadores do Instituto de Berlim para os Fundamentos da Aprendizagem e dos Dados (BIFOLD) da TU Berlin, da Universidade do Luxemburgo e da Google DeepMind desenvolveu um novo modelo de base de aprendizagem automática capaz de simular moléculas de todos os tipos com precisão mecânica quântica. Os resultados foram agora publicados no Journal of the American Chemical Society (JACS). O novo método, denominado SO3LR, combina os mais recentes desenvolvimentos na conceção de redes neuronais com leis físicas e foi treinado com um conjunto de dados especialmente selecionado de quatro milhões de estruturas moleculares diferentes. Isto significa que este modelo não só é capaz de modelizar biomoléculas complexas, como as proteínas, as moléculas de açúcar ou as membranas celulares, como também pode simular uma grande variedade de moléculas sem ter de ser treinado de novo. Este modelo universalmente aplicável abre assim caminho para o desenvolvimento acelerado de medicamentos e para uma compreensão mais profunda da biologia molecular no futuro.

As simulações de dinâmica molecular (MD) permitem compreender e prever o comportamento das moléculas. Permitem a descrição das interações moleculares ao longo do tempo e fornecem informações sobre a sua estrutura, dinâmica e função. A simulação exacta da interação de grandes biomoléculas poderia, por exemplo, permitir o desenvolvimento de novos fármacos sem ter de realizar previamente experiências que exigem muito tempo, material e custos.

Melhorar a exatidão e a aplicabilidade destas simulações tem uma longa tradição na física e na química assistidas por computador. Durante décadas, os investigadores foram confrontados com um conflito fundamental de objectivos: os métodos eram ou rápidos, mas apenas aproximados e não transferíveis para moléculas diferentes, ou extremamente precisos, mas computacionalmente extremamente complexos e dispendiosos. Este conflito de objectivos limitou até agora as simulações de alta precisão a pequenos sistemas com algumas centenas de átomos. As biomoléculas ou proteínas grandes e complexas, no entanto, podem conter muitas dezenas de milhares de átomos, o que limitava as possibilidades de modelar e compreender com precisão processos dinâmicos fundamentais, como a dobragem de proteínas ou a organização celular.

Nos últimos anos, os modelos baseados em IA começaram a colmatar esta lacuna entre os métodos aproximados (clássicos) e os métodos altamente exactos (mecânica quântica). Apesar dos grandes progressos, subsistem dois desafios fundamentais: a escalabilidade destas abordagens para biomoléculas de dimensão realista e a modelização universal num único modelo. O maior obstáculo à aplicação de modelos anteriores a moléculas grandes e complexas tem sido a falta de consideração dos efeitos da mecânica quântica a grandes distâncias. Simplificando, os átomos de uma molécula interagem não só com os seus vizinhos imediatos, mas também com átomos que estão longe. Quanto maior for a molécula, mais importantes se tornam estes efeitos de longo alcance. Sem estas interações de longo alcance, a vida tal como a conhecemos não seria possível, uma vez que as biomoléculas não poderiam funcionar.

O novo modelo SO3LR supera estes desafios e ultrapassa os limites em termos de eficiência, precisão, escalabilidade e universalidade na simulação de moléculas orgânicas. Os investigadores conseguiram-no através de uma abordagem híbrida para a conceção do SO3LR: a complexa tarefa de calcular as interações mecânicas quânticas entre os átomos é dividida em dois componentes complementares. Um modelo de aprendizagem automática rápido e altamente preciso aprende as complexas interações mecânicas quânticas de várias partículas a distâncias curtas e médias. Em paralelo, equações universais de base física descrevem com precisão as interações entre pares a longas distâncias.

"As simulações fiáveis à escala biomolecular dependem destas interações de longo alcance, razão pela qual estão ancoradas na conceção do SO3LR", explica Adil Kabylda da Universidade do Luxemburgo, que liderou o projeto. "Isto permite que o nosso modelo concentre a sua forte capacidade de aprendizagem na captação dos efeitos quânticos complexos que os modelos tradicionais não conseguiram até agora", acrescenta o Dr. Thorben Frank, pós-doutorado no Instituto BIFOLD. O segundo desafio que tinha de ser resolvido era a aplicabilidade universal de um modelo a uma grande variedade de moléculas. Para o conseguir, a equipa criou um conjunto de dados extenso e diversificado de mais de 4 milhões de estruturas moleculares cuidadosamente selecionadas, que o SO3LR utilizou para aprender a descrever com precisão a grande diversidade de moléculas na natureza. Pela primeira vez, este modelo pode simular uma grande variedade de moléculas de grandes dimensões - sem ter de ser previamente treinado.

A inovação do modelo reside na sua universalidade

Para demonstrar as capacidades do SO3LR, a equipa de investigação efectuou uma série de simulações sofisticadas para os quatro principais tipos de biomoléculas existentes na natureza. Por exemplo, simularam grandes proteínas num ambiente aquoso explícito, incluindo a proteína crambina da planta e uma glicoproteína complexa. Também investigaram uma bicamada lipídica-POPC, um sistema modelo para as membranas celulares humanas.

"A principal inovação do SO3LR reside na sua universalidade. Em vez de ter de passar por um longo processo de geração de dados e subsequente treino para cada nova molécula, fornecemos um modelo único e diretamente aplicável. Isto poupa aos investigadores as etapas preparatórias demoradas e computacionalmente intensivas e permite testar diretamente as hipóteses com precisão mecânica quântica", afirma o Prof. Klaus-Robert Müller, co-diretor do BIFOLD. "O SO3LR representa um passo decisivo nesta direção. Ao combinar a aprendizagem automática com princípios físicos, abrimos a porta à modelação de processos biológicos realistas com precisão quântica - com profundas implicações para a compreensão molecular da saúde e da doença, bem como para o desenvolvimento da próxima geração de medicamentos", afirma o Prof. Alexandre Tkatchenko da Universidade do Luxemburgo, resumindo a importância do trabalho.

Numa altura em que os modelos de IA estão cada vez mais nas mãos de empresas privadas, esta equipa de cientistas internacionais decidiu disponibilizar abertamente o modelo e os conjuntos de dados subjacentes à comunidade científica para acelerar os progressos neste domínio.

Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Alemão pode ser encontrado aqui.

Publicação original

Outras notícias do departamento ciência

Notícias mais lidas

Mais notícias de nossos outros portais