Interprétation d'ensembles de données médicales à grande échelle

ScPoli permet des représentations multi-échelles de cellules et d'échantillons

10.10.2023
Computer-generated image

Image symbolique

La quantité croissante de données enregistrées dans la recherche médicale ne peut conduire à des percées scientifiques et à des thérapies essentielles pour les patients que si elle est interprétée et analysée correctement. Les informaticiens du Helmholtz Munich ont mis au point un modèle génératif appelé scPoli (single-cell population level integration), qui réalise l'intégration de données d'ensembles de données à grande échelle de haute qualité sur des cellules uniques afin de créer des cartes de référence du corps humain, appelées atlas de cellules uniques, très utiles pour la recherche médicale.

Les atlas offrent une approche rapide et détaillée pour l'interprétation des données, qui peut être appliquée par la communauté de la recherche médicale, ce qui permet en fin de compte d'obtenir de nouvelles connaissances biologiques et de comprendre les maladies. Le modèle a été introduit dans Nature Methods.

Ces dernières années, nous avons assisté à une augmentation astronomique de la quantité et de la complexité des données, en particulier dans le domaine de la recherche médicale. Les scientifiques sont désormais en mesure de capturer des tissus et des organes dans des détails fascinants, au niveau de la cellule unique. La combinaison des ensembles de données résultants a conduit à la création de ce que l'on appelle des atlas de cellules uniques, qui sont des cartes de référence de chaque cellule présente dans un organe spécifique, dans le but de créer une carte de l'ensemble du corps humain. Ces ensembles de données à grande échelle de haute qualité permettent non seulement d'obtenir de nouvelles informations biologiques sur l'hétérogénéité cellulaire de certains tissus, mais aussi d'accélérer diverses étapes des flux de travail d'analyse qui prennent habituellement beaucoup de temps. Grâce à ces atlas, les chercheurs peuvent désormais, par exemple, comparer des organes d'êtres humains en bonne santé avec des organes de patients malades, ce qui permet de tirer des conclusions précieuses sur le développement et la progression de la maladie.

À mesure que ces atlas prennent de l'ampleur, le besoin de modèles d'apprentissage automatique et d'algorithmes informatiques pour analyser et intégrer les données se fait sentir. Fabian Theis, du Helmholtz Munich et professeur à l'université technique de Munich, ainsi que le Dr Mohammad Lotfollahi et Carlo De Donno, du Computational Health Center du Helmholtz Munich, ont mis au point un nouveau modèle génératif appelé scPoli (abréviation de single-cell population level integration - intégration au niveau de la population d'une seule cellule). Il s'agit du premier modèle d'intégration de données capable de produire des représentations à la fois pour les cellules et les échantillons. Grâce à ce nouveau modèle génératif, les ensembles de données médicales peuvent être facilement analysés afin d'identifier les principales sources de variabilité, tout en étant conscient de l'hétérogénéité naturelle qui se produit entre les données de différents individus et cellules.

L'équipe a développé scPoli dans le but d'améliorer l'interprétabilité des études sur les cellules uniques. Contrairement à d'autres modèles qui ne produisent que des représentations de cellules, scPoli offre aux chercheurs un nouveau point de vue pour étudier et relier les modèles au niveau de l'échantillon, ce qui peut améliorer les flux de travail et l'interprétation de l'intégration.

Fonctionnalité éprouvée : Construire plus rapidement des atlas interprétables

Les chercheurs du Helmholtz Munich ont déjà démontré la fonctionnalité de leur modèle en intégrant des données provenant de deux grands atlas de cellules uniques. L'intégration de l'atlas des cellules pulmonaires humaines, une carte de référence du poumon récemment publiée par l'équipe du professeur Fabian Theis, a permis d'améliorer les performances et d'offrir de nouvelles perspectives au niveau de l'échantillon. En outre, scPoli a été utilisé pour intégrer un atlas PBMC à grande échelle (atlas unicellulaire des cellules mononucléaires du sang périphérique), composé de 7,8 millions de cellules, ce qui met en évidence les propriétés de mise à l'échelle possibles, qui sont fondamentales pour les études d'intégration à grande échelle.

Une caractéristique unique : Le modèle montre des variations entre les échantillons et les cellules

ScPoli est unique par rapport aux efforts précédents d'intégration de données. Il propose divers cas d'utilisation pour l'analyse multi-échelle car, pour la première fois, les scientifiques sont en mesure d'explorer simultanément des représentations de cellules et d'échantillons ou de patients, en saisissant les caractéristiques et les particularités des cellules individuelles de manière beaucoup plus détaillée qu'auparavant. Il est démontré que scPoli peut permettre une classification multi-échelle des cellules et des échantillons, ainsi que des flux de travail guidés pour l'intégration des données. Le modèle a le potentiel d'accélérer la construction et l'utilisation d'atlas, ce qui accélère la compréhension des maladies et le développement de nouvelles thérapies.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails