Des outils d'intelligence artificielle permettent de faire la lumière sur des millions de protéines

L'IA, un outil précieux pour la recherche

22.09.2023

Une équipe de chercheurs de l'Université de Bâle et de l'Institut suisse de bioinformatique SIB a découvert un trésor de protéines non caractérisées. S'appuyant sur la récente révolution de l'apprentissage profond, ils ont découvert des centaines de nouvelles familles de protéines et même un nouveau pli protéique prédit. L'étude vient d'être publiée dans "Nature".

University of Basel, Biozentrum

Un aperçu du réseau interactif "Protein Universe Atlas".

Ces dernières années, AlphaFold a révolutionné la science des protéines. Cet outil d'intelligence artificielle (IA) a été formé à partir de données sur les protéines collectées par les scientifiques du vivant depuis plus de 50 ans, et il est capable de prédire la forme 3D des protéines avec une grande précision. Son succès a conduit à la modélisation de 215 millions de protéines l'année dernière, ce qui permet d'obtenir des informations sur la forme de presque toutes les protéines. Ceci est particulièrement intéressant pour les protéines qui n'ont pas été étudiées expérimentalement, un processus complexe qui prend du temps.

"Il existe aujourd'hui de nombreuses sources d'informations sur les protéines, qui fournissent des indications précieuses sur leur évolution et leur fonctionnement", explique Joana Pereira, responsable de l'étude. Néanmoins, la recherche a longtemps été confrontée à une jungle de données. L'équipe de recherche dirigée par le professeur Torsten Schwede, chef de groupe au Biozentrum de l'université de Bâle et à l'Institut suisse de bio-informatique (SIB), est parvenue à décrypter une partie des informations dissimulées.

Une vue d'ensemble révèle de nouvelles familles et de nouveaux plis de protéines

Les chercheurs ont construit un réseau interactif de 53 millions de protéines avec des structures AlphaFold de haute qualité. "Ce réseau constitue une source précieuse pour prédire théoriquement des familles de protéines inconnues et leurs fonctions à grande échelle", souligne le Dr Janani Durairaj, premier auteur. L'équipe a pu identifier 290 nouvelles familles de protéines et un nouveau pli protéique qui ressemble à la forme d'une fleur.

S'appuyant sur l'expertise du groupe Schwede en matière de développement et de maintenance du logiciel de pointe SWISS-MODEL, ils ont mis le réseau à disposition sous la forme d'une ressource web interactive, appelée "Atlas de l'univers des protéines".

L'IA, un outil précieux pour la recherche

L'équipe a utilisé des outils basés sur l'apprentissage profond pour trouver des nouveautés dans ce réseau, ouvrant ainsi la voie à des innovations dans les sciences de la vie, de la recherche fondamentale à la recherche appliquée. "La compréhension de la structure et de la fonction des protéines est généralement l'une des premières étapes du développement d'un nouveau médicament ou de la modification de leurs fonctions par l'ingénierie des protéines, par exemple", explique M. Pereira. Ces travaux ont été financés par une subvention "kickstarter" du SIB visant à encourager l'adoption de l'IA dans les ressources des sciences de la vie. Il souligne le potentiel de transformation de l'apprentissage profond et des algorithmes intelligents dans la recherche.

Grâce à l'atlas de l'univers des protéines, les scientifiques peuvent désormais en savoir plus sur les protéines pertinentes pour leurs recherches. "Nous espérons que cette ressource aidera non seulement les chercheurs et les biocurateurs, mais aussi les étudiants et les enseignants en fournissant une nouvelle plateforme d'apprentissage sur la diversité des protéines, de la structure à la fonction, en passant par l'évolution", déclare Janani Durairaj.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails