Règles équitables pour le partage des données de séquençage : nouvelle feuille de route dans Nature Microbiology

Combiner ouverture et équité dans les sciences de la vie à forte intensité de données

30.09.2025
Copyright: University of Duisburg-Essen

Illustration métaphorique de l'identifiant de réutilisation des données : les informations génétiques contenues dans les bases de données publiques sont liées à leurs auteurs et réutilisées équitablement par d'autres chercheurs.

Les ensembles de données sur l'ADN et l'ARN dans les dépôts publics augmentent à un rythme sans précédent, créant un atlas mondial de la diversité microbienne. Si le libre accès continue de faire progresser la recherche, il pose également un dilemme : les données recueillies avec minutie sont souvent mises à la disposition du monde entier avant que les chercheurs qui les ont générées puissent publier leurs propres résultats. En réponse à cette situation, un consortium international de plus de 230 scientifiques, dirigé par le professeur Alexander Probst de l'université de Duisbourg-Essen, a publié dans Nature Microbiology une feuille de route visant à promouvoir un traitement plus équitable des données de séquençage publiques.

"Les données ouvertes sont le carburant de la science moderne - en particulier à l'ère du Big Data et du data mining", explique le professeur Alexander Probst, professeur de métagénomique environnementale à l'université de Duisbourg-Essen et au centre de recherche One Health Ruhr. "Mais la collecte, le traitement et l'analyse des échantillons nécessitent souvent des mois de travail. Cette contribution ne doit pas être ignorée".

L'accord de Fort Lauderdale de 2003 exigeait déjà que les données sur les séquences d'ADN et d'ARN soient rendues publiques dans les 24 heures suivant leur production. À l'époque, les volumes étaient encore gérables et le libre accès est rapidement devenu un moteur du progrès scientifique.

Aujourd'hui, cependant, le séquençage à haut débit produit des volumes si importants qu'ils peuvent remplir des fermes de serveurs entières. En microbiologie, cela a permis la création d'atlas numériques de la diversité - construits à partir d'échantillons souvent collectés au cours d'expéditions ardues et grâce à un travail de laboratoire méticuleux, souvent réalisé par des chercheurs en début de carrière. Une fois téléchargées, ces données sont immédiatement accessibles dans le monde entier, souvent bien avant que les collecteurs originaux n'aient eu la possibilité de publier leurs propres résultats.

Pour atténuer cette tension, l'équipe chargée des droits d'auteur a élaboré une feuille de route visant à concilier ouverture et équité dans le domaine des sciences de la vie, où les données sont nombreuses. Le libre accès reste le principe directeur, mais il est désormais complété par un code d'honneur qui fixe des règles plus claires pour la réutilisation.

Au cœur des recommandations figure l'introduction d'une "étiquette de réutilisation des données (DRI)" pour les ensembles de données, liée à l'identifiant numérique ORCID du chercheur, qui attribue sans ambiguïté les contributions à une ou plusieurs personnes. Les chercheurs qui fournissent leur identifiant signalent effectivement : veuillez nous contacter avant de réutiliser ces données. En l'absence d'identifiant, les données sont considérées comme librement réutilisables. Pour le matériel qui n'est pas accompagné d'une publication formelle, les collecteurs de données originaux devraient être activement impliqués.

"Le libre accès reste essentiel", souligne M. Probst. "La valeur de la disponibilité immédiate des données est particulièrement évidente en cas de pandémie. Sans cela, le développement rapide de vaccins contre le SRAS-CoV-2 à l'échelle mondiale n'aurait guère été possible. Notre objectif est maintenant d'établir des pratiques quotidiennes plus équitables qui garantissent que ceux qui collectent les données sont reconnus et inclus dans les nouveaux projets".

La feuille de route est le résultat de discussions approfondies avec plusieurs centaines de chercheurs dans le monde entier. Une enquête internationale soutenue par le professeur Anke Heyder (Université de la Ruhr à Bochum) a notamment servi de base. L'étude a été coordonnée par le professeur Alexander Probst en collaboration avec les docteurs Christina Moraru et André Soares (tous deux de l'université de Duisbourg-Essen), le professeur Folker Meyer (Institut d'intelligence artificielle en médecine/université de médecine d'Essen), le professeur Laura A. Hug (université de Waterloo, Canada) et le professeur Roland Hatzenpichler (université de l'État du Montana, États-Unis).

Au sein du centre de recherche collaborative RESIST, qui a soutenu l'initiative, l'équipe de recherche sur l'eau de l'université de Duisbourg-Essen sera la première à mettre en œuvre la feuille de route. "Nous étudions ici la façon dont les rivières réagissent aux facteurs de stress tels que les polluants ou les espèces envahissantes. Nous avons déjà recueilli plus de 34 téraoctets de données de séquences, non seulement pour des organismes individuels, mais aussi pour des communautés entières. Avec une telle densité de données, RESIST est le banc d'essai idéal pour établir la nouvelle routine de traitement des données de recherche", explique M. Probst.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails

Si près que même
les molécules
deviennent rouges...