L'IA identifie les cellules cancéreuses

"Ikarus nous permet d'identifier les gènes qui sont des moteurs potentiels du cancer".

14.06.2022 - Allemagne

Comment les cellules cancéreuses diffèrent-elles des cellules saines ? Un nouvel algorithme d'apprentissage automatique appelé "ikarus" connaît la réponse, rapporte une équipe dirigée par Altuna Akalin, bioinformaticien au MDC, dans la revue Genome Biology. Le programme d'IA a trouvé une signature génétique caractéristique des tumeurs.

pixabay.com

Image symbolique

Lorsqu'il s'agit d'identifier des modèles dans des montagnes de données, les êtres humains ne font pas le poids face à l'intelligence artificielle (IA). En particulier, une branche de l'IA appelée apprentissage automatique est souvent utilisée pour trouver des régularités dans des ensembles de données, que ce soit pour l'analyse des marchés boursiers, la reconnaissance des images et de la parole ou la classification des cellules. Pour distinguer de manière fiable les cellules cancéreuses des cellules saines, une équipe dirigée par le Dr Altuna Akalin, responsable de la plateforme de science des données bioinformatiques et omiques au Centre Max Delbrück de médecine moléculaire de l'Association Helmholtz (MDC), a mis au point un programme d'apprentissage automatique appelé "ikarus". Le programme a trouvé un modèle dans les cellules tumorales qui est commun à différents types de cancer, consistant en une combinaison caractéristique de gènes. Selon l'article publié par l'équipe dans la revue Genome Biology, l'algorithme a également détecté des types de gènes dans le modèle qui n'avaient jamais été clairement liés au cancer auparavant.

L'apprentissage automatique signifie essentiellement qu'un algorithme utilise des données d'apprentissage pour apprendre à répondre à certaines questions par lui-même. Pour ce faire, il recherche des modèles dans les données qui l'aident à résoudre les problèmes. Après la phase d'apprentissage, le système peut généraliser à partir de ce qu'il a appris afin d'évaluer des données inconnues. Il était très difficile d'obtenir des données d'entraînement adéquates lorsque les experts avaient déjà établi une distinction claire entre les cellules "saines" et "cancéreuses"", explique Jan Dohmen, premier auteur de l'article.

Un taux de réussite étonnamment élevé

En outre, les ensembles de données de séquençage unicellulaire sont souvent bruités. Cela signifie que les informations qu'ils contiennent sur les caractéristiques moléculaires des cellules individuelles ne sont pas très précises - peut-être parce qu'un nombre différent de gènes est détecté dans chaque cellule, ou parce que les échantillons ne sont pas toujours traités de la même manière. Comme le rapportent M. Dohmen et son collègue, le Dr Vedran Franke, co-responsable de l'étude, ils ont passé au crible d'innombrables publications et ont contacté un grand nombre de groupes de recherche afin d'obtenir des ensembles de données adéquats. L'équipe a finalement utilisé des données provenant de cellules de cancer du poumon et de cancer colorectal pour entraîner l'algorithme avant de l'appliquer à des ensembles de données d'autres types de tumeurs.

Dans la phase d'entraînement, ikarus a dû trouver une liste de gènes caractéristiques qu'il a ensuite utilisée pour catégoriser les cellules. "Nous avons essayé et affiné différentes approches", explique M. Dohmen. Ce travail a pris beaucoup de temps, comme le racontent les trois scientifiques. "L'essentiel était qu'ikarus utilise finalement deux listes : une pour les gènes du cancer et une pour les gènes d'autres cellules", explique M. Franke. Après la phase d'apprentissage, l'algorithme a pu distinguer de manière fiable les cellules saines des cellules tumorales dans d'autres types de cancer également, comme dans des échantillons de tissus provenant de patients atteints de cancer du foie ou de neuroblastome. Son taux de réussite tendait à être extraordinairement élevé, ce qui a surpris même le groupe de recherche. "Nous ne nous attendions pas à ce qu'il y ait une signature commune qui définisse si précisément les cellules tumorales de différents types de cancer", dit Akalin. "Mais nous ne pouvons toujours pas dire si la méthode fonctionne pour tous les types de cancer", ajoute M. Dohmen. Pour faire d'ikarus un outil fiable de diagnostic du cancer, les chercheurs veulent maintenant le tester sur d'autres types de tumeurs.

L'IA comme outil de diagnostic entièrement automatisé

Le projet vise à aller bien au-delà de la classification des cellules "saines" et "cancéreuses". Lors des premiers tests, ikarus a déjà démontré que la méthode peut également distinguer d'autres types (et certains sous-types) de cellules des cellules tumorales. "Nous voulons rendre l'approche plus complète", dit Akalin, "en la développant davantage pour qu'elle puisse distinguer tous les types de cellules possibles dans une biopsie."

Dans les hôpitaux, les pathologistes ont tendance à n'examiner au microscope que des échantillons de tissus de tumeurs afin d'identifier les différents types de cellules. C'est un travail laborieux qui prend beaucoup de temps. Avec ikarus, cette étape pourrait un jour devenir un processus entièrement automatisé. En outre, note M. Akalin, les données pourraient être utilisées pour tirer des conclusions sur l'environnement immédiat de la tumeur. Et cela pourrait aider les médecins à choisir la meilleure thérapie. Car la composition du tissu cancéreux et du microenvironnement indique souvent si un certain traitement ou médicament sera efficace ou non. En outre, l'IA peut également être utile pour développer de nouveaux médicaments. "Ikarus nous permet d'identifier les gènes qui sont des moteurs potentiels du cancer", explique M. Akalin. De nouveaux agents thérapeutiques pourraient alors être utilisés pour cibler ces structures moléculaires.

Une collaboration maison-bureau

Un aspect remarquable de la publication est qu'elle a été entièrement préparée pendant la pandémie de COVID. Toutes les personnes concernées n'étaient pas à leur bureau habituel à l'Institut de biologie des systèmes médicaux de Berlin (BIMSB), qui fait partie du MDC. Ils se trouvaient plutôt dans des bureaux à domicile et ne communiquaient entre eux que par voie numérique. Selon Franke, "le projet montre donc qu'il est possible de créer une structure numérique pour faciliter le travail scientifique dans ces conditions."

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails

L'intelligence artificielle révolutionne-t-elle les sciences de la vie ?