Des outils d'intelligence artificielle prédisent le rôle régulateur et la structure 3D de l'ADN

Les algorithmes de modélisation des séquences pourraient à terme déboucher sur de nouveaux moyens de lutter contre les maladies causées par des mutations génétiques

10.08.2022 - Etats-Unis

Des programmes d'intelligence artificielle (IA) récemment mis au point ont prédit avec précision le rôle des éléments régulateurs et de la structure tridimensionnelle (3D) de l'ADN en se basant uniquement sur sa séquence brute, selon deux études récentes parues dans Nature Genetics. Ces outils pourraient éventuellement apporter un nouvel éclairage sur la façon dont les mutations génétiques conduisent à la maladie et permettre de mieux comprendre comment la séquence génétique influence l'organisation spatiale et la fonction de l'ADN chromosomique dans le noyau, a déclaré l'auteur de l'étude, Jian Zhou, Ph.D., professeur adjoint au département de bioinformatique Lyda Hill de l'UTSW.

UT Southwestern Medical Center

Structure 3D prédite pour un segment d'ADN génomique humain

"Pris ensemble, ces deux programmes fournissent une image plus complète de la façon dont les changements dans la séquence de l'ADN, même dans les régions non codantes, peuvent avoir des effets spectaculaires sur son organisation spatiale et sa fonction", a déclaré le Dr Zhou, membre du Harold C. Simmons Comprehensive Cancer Center, boursier de la Fondation Lupe Murchison pour la recherche médicale et boursier du Cancer Prevention and Research Institute of Texas (CPRIT).

Environ 1 % seulement de l'ADN humain code des instructions pour la fabrication de protéines. Les recherches menées au cours des dernières décennies ont montré qu'une grande partie du matériel génétique non codant restant contient des éléments régulateurs - tels que des promoteurs, des amplificateurs, des silencieux et des isolateurs - qui contrôlent la manière dont l'ADN codant est exprimé. La façon dont la séquence contrôle les fonctions de la plupart de ces éléments régulateurs n'est pas bien comprise, a expliqué le Dr Zhou.

Pour mieux comprendre ces éléments de régulation, il a mis au point, avec des collègues de l'université de Princeton et du Flatiron Institute, un modèle d'apprentissage profond qu'ils ont baptisé Sei, qui classe avec précision ces bribes d'ADN non codant en 40 "classes de séquences" ou emplois - par exemple, en tant qu'amplificateur de l'activité génique des cellules souches ou des cellules cérébrales. Ces 40 classes de séquences, élaborées à partir de près de 22 000 ensembles de données provenant d'études antérieures sur la régulation du génome, couvrent plus de 97 % du génome humain. En outre, Sei peut évaluer toute séquence en fonction de son activité prédite dans chacune des 40 classes de séquences et prédire l'impact des mutations sur ces activités.

En appliquant Sei aux données de génétique humaine, les chercheurs ont pu caractériser l'architecture de régulation de 47 traits et maladies enregistrés dans la base de données de la UK Biobank et expliquer comment les mutations des éléments de régulation provoquent des pathologies spécifiques. De telles capacités peuvent contribuer à une compréhension plus systématique de la manière dont les modifications de la séquence génomique sont liées aux maladies et autres traits. Ces résultats ont été publiés ce mois-ci.

En mai, M. Zhou a présenté le développement d'un autre outil, appelé Orca, qui prédit l'architecture 3D de l'ADN dans les chromosomes sur la base de sa séquence. À l'aide d'ensembles de données existants de séquences d'ADN et de données structurelles dérivées d'études antérieures qui ont révélé les plis, les torsions et les tours de la molécule, le Dr Zhou a entraîné le modèle à établir des connexions et a évalué la capacité du modèle à prédire la structure à diverses échelles de longueur.

Les résultats ont montré qu'Orca prédisait avec une grande précision les structures d'ADN, petites et grandes, à partir de leurs séquences, y compris pour les séquences portant des mutations associées à divers problèmes de santé, dont une forme de leucémie et des malformations des membres. Orca a également permis aux chercheurs de formuler de nouvelles hypothèses sur la manière dont la séquence d'ADN contrôle sa structure 3D locale et à grande échelle.

Le Dr Zhou a déclaré que lui et ses collègues prévoient d'utiliser Sei et Orca, qui sont tous deux accessibles au public sur des serveurs Web et sous forme de code source ouvert, pour explorer plus avant le rôle des mutations génétiques dans les manifestations moléculaires et physiques des maladies - une recherche qui pourrait éventuellement déboucher sur de nouveaux moyens de traiter ces pathologies.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails