Nouvelle étude sur la compréhension du fonctionnement des protéines grâce à l'intelligence artificielle
Des scientifiques affiliés à la Freie Universität Berlin contribuent à la percée de Microsoft Research dans le domaine de la modélisation des protéines
Une avancée scientifique majeure dans la modélisation des protéines, développée par Microsoft Research AI for Science, a été publiée dans le numéro du 10 juillet de Science. L'étude présente BioEmu, un système génératif d'apprentissage profond qui émule le comportement d'équilibre des protéines avec une rapidité et une précision sans précédent.
La fonction biologique des protéines dépendant des changements dynamiques de leur structure, la capacité de prédire ces changements structurels rapidement et avec précision ouvre la voie à des décisions de conception plus rationnelles dans la découverte de médicaments, contribuant ainsi à réduire le taux d'échec des médicaments dans les essais cliniques.
BioEmu peut générer des milliers de structures protéiques statistiquement indépendantes par heure sur une seule unité de traitement graphique (GPU). "Cela réduit le coût et le temps nécessaire à l'analyse des changements de structure fonctionnelle des protéines", explique le professeur Frank Noé, qui a dirigé le projet. BioEmu intègre plus de 200 millisecondes de simulations de dynamique moléculaire avec des données expérimentales pour prédire les ensembles structurels et les propriétés thermodynamiques avec une précision proche de l'expérience.
Le système capture des phénomènes biologiques complexes tels que la formation de poches de liaison cachées, les mouvements de domaines et le dépliage local, qui sont tous essentiels à la compréhension de la fonction des protéines et à la conception de médicaments. BioEmu prédit également les changements de stabilité des protéines avec une précision qui peut rivaliser avec les expériences de laboratoire. "BioEmu fournit ainsi une méthode évolutive pour modéliser la fonction des protéines à l'échelle génomique", ajoute le professeur Cecilia Clementi.
Le code et le modèle BioEmu sont disponibles gratuitement sous la licence permissive MIT. Parallèlement à la publication, Microsoft Research a également publié l'ensemble de données de simulation de dynamique moléculaire qui a été généré pour entraîner BioEmu. Cet ensemble de données, qui comprend plus de 100 millisecondes de simulations sur des milliers de systèmes protéiques, représente le plus grand ensemble de simulations de protéines à séquence variée accessible au public à ce jour.
Bien que la recherche ait été entièrement menée à Microsoft, la Freie Universität Berlin est fière de reconnaître les contributions des chercheurs affiliés. La recherche a été dirigée par Frank Noé, Partner Research Manager chez Microsoft Research AI for Science à Berlin, qui est également professeur honoraire à la Freie Universität Berlin. Cecilia Clementi, professeur Einstein de biophysique théorique et informatique à la Freie Universität Berlin, a apporté des contributions essentielles à ce travail en tant que chercheuse invitée à Microsoft Research.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.
Publication originale
Sarah Lewis, Tim Hempel, José Jiménez-Luna, Michael Gastegger, Yu Xie, Andrew Y. K. Foong, Victor García Satorras, Osama Abdin, Bastiaan S. Veeling, Iryna Zaporozhets, ... Hannes Schulz, Usman Munir, Roberto Sordillo, Ryota Tomioka, Cecilia Clementi, Frank Noé; "Scalable emulation of protein equilibrium ensembles with generative deep learning"; Science, 2025-7-10