Simulazione di grandi biomolecole con precisione quantistica

Il nuovo modello di AI spinge i confini in termini di universalità, efficienza, accuratezza e scalabilità

03.09.2025
AI-generated image

Immagine simbolo

Un team internazionale di ricercatori dell'Istituto di Berlino per i fondamenti dell'apprendimento e dei dati (BIFOLD) presso la TU di Berlino, dell'Università del Lussemburgo e di Google DeepMind ha sviluppato un nuovo modello di fondamenti di apprendimento automatico in grado di simulare molecole di tutti i tipi con una precisione meccanica quantistica. I risultati sono stati pubblicati sul Journal of the American Chemical Society (JACS). Il nuovo metodo, chiamato SO3LR, combina gli ultimi sviluppi nella progettazione di reti neurali con le leggi fisiche ed è stato addestrato con un set di dati appositamente curato di quattro milioni di strutture molecolari diverse. Ciò significa che questo modello non solo è in grado di modellare biomolecole complesse, come proteine, molecole di zucchero o membrane cellulari, ma può anche simulare un'ampia varietà di molecole senza dover essere riaddestrato. Questo modello universalmente applicabile apre quindi la strada a uno sviluppo accelerato dei farmaci e a una comprensione più approfondita della biologia molecolare in futuro.

Le simulazioni di dinamica molecolare (MD) consentono di comprendere e prevedere il comportamento delle molecole. Consentono di descrivere le interazioni molecolari nel tempo e forniscono approfondimenti sulla loro struttura, dinamica e funzione. La simulazione esatta dell'interazione di grandi biomolecole potrebbe, ad esempio, rendere possibile lo sviluppo di nuovi farmaci senza dover effettuare prima esperimenti che richiedono tempo, materiali e costi elevati.

Il miglioramento dell'accuratezza e dell'applicabilità di queste simulazioni ha una lunga tradizione nella fisica e nella chimica assistita da computer. Per decenni, i ricercatori si sono trovati di fronte a un conflitto fondamentale di obiettivi: i metodi erano veloci, ma solo approssimativi e non trasferibili a molecole diverse, oppure estremamente accurati, ma computazionalmente estremamente complessi e costosi. Questo conflitto di obiettivi ha finora limitato le simulazioni ad alta precisione a piccoli sistemi con poche centinaia di atomi. Le biomolecole o le proteine grandi e complesse, invece, possono contenere molte decine di migliaia di atomi, il che ha limitato le possibilità di modellare con precisione e comprendere processi dinamici fondamentali come il ripiegamento delle proteine o l'organizzazione cellulare.

Negli ultimi anni, i modelli basati sull'intelligenza artificiale hanno iniziato a colmare questo divario tra i metodi approssimativi (classici) e quelli altamente accurati (meccanici quantistici). Nonostante i grandi progressi, rimangono due sfide fondamentali: la scalabilità di questi approcci a biomolecole di dimensioni realistiche e la modellazione universale in un unico modello. Il più grande ostacolo all'applicazione dei modelli precedenti per molecole grandi e complesse è stata la mancanza di considerazione degli effetti quantomeccanici su grandi distanze. In parole povere, gli atomi di una molecola interagiscono non solo con i loro immediati vicini, ma anche con atomi distanti. Più la molecola è grande, più questi effetti a lungo raggio diventano importanti. Senza queste interazioni a lungo raggio, la vita come la conosciamo non sarebbe possibile, poiché le biomolecole non sarebbero in grado di funzionare.

Il nuovo modello SO3LR supera queste sfide e si spinge oltre in termini di efficienza, accuratezza, scalabilità e universalità nella simulazione di molecole organiche. I ricercatori hanno ottenuto questo risultato perseguendo un approccio ibrido per la progettazione di SO3LR: il complesso compito di calcolare le interazioni quantomeccaniche tra gli atomi è stato suddiviso in due componenti complementari. Un modello di apprendimento automatico veloce e altamente accurato apprende le complesse interazioni quantomeccaniche multiparticella a breve e media distanza. In parallelo, equazioni universali basate sulla fisica descrivono con precisione le interazioni a coppie su lunghe distanze.

"Simulazioni affidabili su scala biomolecolare dipendono da queste interazioni a lungo raggio, ed è per questo che sono ancorate nel progetto di SO3LR", spiega Adil Kabylda dell'Università del Lussemburgo, che ha guidato il progetto. "Questo permette al nostro modello di concentrare la sua forte capacità di apprendimento sulla cattura dei complessi effetti quantistici che i modelli tradizionali hanno finora mancato", aggiunge il dottor Thorben Frank, postdoc presso l'Istituto BIFOLD. La seconda sfida da risolvere era l'applicabilità universale di un modello a un'ampia varietà di molecole. Per raggiungere questo obiettivo, il team ha creato un ampio e diversificato set di dati di oltre 4 milioni di strutture molecolari accuratamente curate, che SO3LR ha utilizzato per imparare a descrivere accuratamente la grande diversità di molecole in natura. Per la prima volta, questo modello è in grado di simulare un'ampia varietà di molecole di grandi dimensioni, senza dover essere riqualificato in anticipo.

Il punto di forza del modello sta nella sua universalità

Per dimostrare le capacità di SO3LR, il team di ricerca ha effettuato una serie di sofisticate simulazioni per tutti e quattro i principali tipi di biomolecole presenti in natura. Ad esempio, hanno simulato grandi proteine in un ambiente acquatico esplicito, tra cui la proteina crambin delle piante e una glicoproteina complessa. Hanno anche studiato un bilayer lipidico-POPC, un sistema modello per le membrane cellulari umane.

"L'innovazione chiave di SO3LR sta nella sua universalità. Invece di dover affrontare un lungo processo di generazione dei dati e di successivo addestramento per ogni nuova molecola, forniamo un unico modello direttamente applicabile. Ciò consente ai ricercatori di risparmiare le lunghe fasi preparatorie e di calcolo e permette di testare direttamente le ipotesi con precisione quantomeccanica", afferma il Prof. Klaus-Robert Müller, co-direttore di BIFOLD. "SO3LR rappresenta un passo decisivo in questa direzione. Combinando l'apprendimento automatico con i principi fisici, apriamo la porta alla modellazione di processi biologici realistici con precisione quantistica, con profonde implicazioni per la comprensione molecolare della salute e delle malattie e per lo sviluppo della prossima generazione di farmaci", afferma il Prof. Alexandre Tkatchenko dell'Università del Lussemburgo, riassumendo l'importanza del lavoro.

In un momento in cui i modelli di intelligenza artificiale sono sempre più nelle mani di aziende private, questo team di scienziati internazionali ha deciso di rendere il modello e i set di dati sottostanti apertamente disponibili alla comunità scientifica per accelerare ulteriori progressi in questo campo.

Nota: questo articolo è stato tradotto utilizzando un sistema informatico senza intervento umano. LUMITOS offre queste traduzioni automatiche per presentare una gamma più ampia di notizie attuali. Poiché questo articolo è stato tradotto con traduzione automatica, è possibile che contenga errori di vocabolario, sintassi o grammatica. L'articolo originale in Tedesco può essere trovato qui.

Pubblicazione originale

Altre notizie dal dipartimento scienza

Le notizie più lette

Altre notizie dagli altri portali