Les modèles d'IA pour la conception de médicaments échouent en physique

31.10.2025

Les programmes d'intelligence artificielle les plus modernes peuvent contribuer à la mise au point de médicaments en prédisant la manière dont les protéines interagissent avec les petites molécules. Toutefois, des chercheurs de l'université de Bâle ont montré que ces programmes ne font que mémoriser des modèles, sans comprendre les relations physiques. Ils échouent souvent lorsqu'il s'agit de trouver de nouvelles protéines qui présenteraient un intérêt particulier pour des médicaments innovants.

Les protéines jouent un rôle clé non seulement dans l'organisme, mais aussi en médecine : elles servent soit de principes actifs, comme les enzymes ou les anticorps, soit de structures cibles pour les médicaments. La première étape du développement de nouvelles thérapies consiste donc généralement à déchiffrer la structure tridimensionnelle des protéines.

Pendant longtemps, l'élucidation des structures protéiques a été une entreprise extrêmement complexe, jusqu'à ce que l'apprentissage automatique fasse son entrée dans la recherche sur les protéines. Des modèles d'IA portant des noms tels qu'AlphaFold ou RosettaFold ont ouvert une nouvelle ère : ils calculent comment la chaîne des éléments constitutifs des protéines, appelés acides aminés, se plie en une structure tridimensionnelle. En 2024, les développeurs de ces programmes ont reçu le prix Nobel de chimie.

AI-generated image

Image symbolique

Un taux de réussite suspect

Les dernières versions de ces programmes vont plus loin : elles calculent l'interaction de la protéine en question avec une autre molécule - un partenaire d'amarrage ou "ligand", comme l'appellent les experts. Il peut s'agir d'un ingrédient pharmaceutique actif, par exemple.

"Cette possibilité de prédire la structure des protéines avec un ligand est inestimable pour le développement de médicaments", explique le professeur Markus Lill de l'université de Bâle. Avec son équipe du département des sciences pharmaceutiques, il étudie les méthodes de conception des ingrédients pharmaceutiques actifs.

Cependant, les taux de réussite apparemment élevés de la prédiction structurelle ont laissé Lill et son équipe perplexes. D'autant plus qu'il n'existe qu'environ 100 000 structures de protéines déjà élucidées avec leurs ligands pour l'entraînement des modèles d'IA, ce qui est relativement peu par rapport à d'autres ensembles de données d'entraînement pour l'IA. "Nous voulions savoir si ces modèles d'IA apprennent réellement les bases de la chimie physique à l'aide des données d'entraînement et s'ils les appliquent correctement", explique M. Lill.

Même prédiction pour des sites de liaison significativement modifiés

Les chercheurs ont modifié la séquence d'acides aminés de centaines d'échantillons de protéines de telle sorte que les sites de liaison de leurs ligands présentaient une distribution de charges complètement différente ou étaient même complètement bloqués. Néanmoins, les modèles d'IA ont prédit la même structure complexe, comme si la liaison était toujours possible. Les chercheurs ont suivi une approche similaire avec les ligands : ils les ont modifiés de manière à ce qu'ils ne puissent plus s'arrimer à la protéine en question. Les modèles d'IA n'ont pas non plus été perturbés.

Dans plus de la moitié des cas, les modèles ont prédit la structure comme si les interférences dans la séquence d'acides aminés n'avaient jamais eu lieu. "Cela nous montre que même les modèles d'IA les plus avancés ne comprennent pas vraiment pourquoi un médicament se lie à une protéine ; ils ne font que reconnaître des schémas qu'ils ont déjà vus auparavant", déclare Lill.

Les protéines inconnues sont particulièrement difficiles

Les modèles d'IA ont rencontré des difficultés particulières lorsque les protéines ne présentaient aucune similitude avec les ensembles de données d'apprentissage. "Lorsqu'ils découvrent quelque chose de totalement nouveau, ils sont rapidement dépassés, mais c'est précisément là que réside la clé des nouveaux médicaments", souligne Markus Lill.

Les modèles d'IA doivent donc être considérés avec prudence lorsqu'il s'agit du développement de médicaments. Il est important de valider les prédictions des modèles à l'aide d'expériences ou d'analyses assistées par ordinateur qui prennent réellement en compte les propriétés physico-chimiques. Les chercheurs ont également utilisé ces méthodes pour examiner les résultats des modèles d'IA dans le cadre de leur étude.

"La meilleure solution serait d'intégrer les lois physico-chimiques dans les futurs modèles d'IA", explique Lill. Grâce à des prédictions structurelles plus réalistes, ceux-ci pourraient constituer une meilleure base pour le développement de nouveaux médicaments, en particulier pour les structures de protéines qui ont été jusqu'à présent difficiles à élucider, et ouvriraient la voie à des approches thérapeutiques entièrement nouvelles.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails