Regras justas para a partilha de dados de sequências: novo roteiro na Nature Microbiology

Combinar a abertura e a equidade nas ciências da vida com utilização intensiva de dados

30.09.2025
Copyright: University of Duisburg-Essen

Ilustração metafórica do identificador de reutilização de dados: as informações genéticas nas bases de dados públicas estão ligadas aos seus autores e são reutilizadas de forma justa por outros investigadores

Os conjuntos de dados de ADN e ARN em repositórios públicos estão a expandir-se a um ritmo sem precedentes, criando um atlas global da diversidade microbiana. Embora o acesso livre continue a impulsionar a investigação, também apresenta um dilema: os dados cuidadosamente recolhidos são frequentemente disponibilizados a nível mundial antes de os investigadores que os geraram poderem publicar as suas próprias descobertas. Em resposta, um consórcio internacional de mais de 230 cientistas, liderado pelo Professor Alexander Probst da Universidade de Duisburg-Essen, publicou um roteiro na revista Nature Microbiology para promover um tratamento mais justo dos dados de sequências públicas.

"Os dados abertos são o combustível da ciência moderna, especialmente na era dos grandes volumes de dados e da extração de dados", afirma o Professor Alexander Probst, Professor de Metagenómica Ambiental na Universidade de Duisburg-Essen e no Centro de Investigação One Health Ruhr. "Mas a recolha, o processamento e a análise de amostras requerem frequentemente meses de trabalho. Essa contribuição não pode deixar de ser reconhecida."

O Acordo de Fort Lauderdale de 2003 já exigia que os dados relativos às sequências de ADN e ARN fossem disponibilizados ao público no prazo de 24 horas após a sua geração. Na altura, os volumes ainda eram manejáveis e o acesso livre tornou-se rapidamente um motor do progresso científico.

Atualmente, porém, a sequenciação de alto rendimento produz volumes tão grandes que podem encher parques de servidores inteiros. Na microbiologia, isto permitiu a criação de atlas digitais da diversidade - construídos a partir de amostras frequentemente recolhidas durante expedições árduas e através de um trabalho laboratorial meticuloso, frequentemente realizado por investigadores em início de carreira. Uma vez carregados, estes dados ficam imediatamente acessíveis em todo o mundo - muitas vezes muito antes de os colectores originais terem tido a oportunidade de publicar os seus próprios resultados.

Para aliviar esta tensão, a equipa de autoria desenvolveu um roteiro que procura equilibrar a abertura com a justiça nas ciências da vida com grande volume de dados. O acesso aberto continua a ser o princípio orientador, mas é agora complementado por um código de honra que estabelece regras mais claras para a reutilização.

No centro das recomendações está a introdução de uma "etiqueta de informação sobre reutilização de dados (DRI)" para os conjuntos de dados, ligada ao identificador digital de investigador ORCID, que atribui inequivocamente as contribuições a um ou mais indivíduos. Os investigadores que fornecem o seu identificador estão efetivamente a sinalizar: por favor, entrem em contacto antes de reutilizarem estes dados. Se o identificador estiver ausente, os dados são considerados livremente reutilizáveis. Para o material não acompanhado de uma publicação formal, os colectores de dados originais devem ser ativamente envolvidos.

"O acesso livre continua a ser essencial", sublinha Probst. "O valor de ter dados imediatamente disponíveis é particularmente evidente em tempos de pandemia. Sem isso, o rápido desenvolvimento global de vacinas contra o SARS-CoV-2 dificilmente teria sido possível. O nosso objetivo agora é estabelecer práticas quotidianas mais justas que garantam que aqueles que recolhem os dados sejam reconhecidos e incluídos em novos projectos".

O roteiro é o resultado de amplas discussões com várias centenas de investigadores de todo o mundo. Entre os alicerces, conta-se um inquérito internacional apoiado pela Professora Anke Heyder (Universidade Ruhr de Bochum). O estudo foi coordenado pelo Professor Alexander Probst, juntamente com a Dr.ª Christina Moraru e o Dr. André Soares (ambos da Universidade de Duisburg-Essen), o Professor Folker Meyer (Instituto de Inteligência Artificial em Medicina/Medicina Universitária de Essen), a Professora Laura A. Hug (Universidade de Waterloo, Canadá) e o Professor Roland Hatzenpichler (Universidade Estatal de Montana, EUA).

No âmbito do Centro de Investigação Colaborativa RESIST, que apoiou a iniciativa, a equipa de investigação sobre a água da Universidade de Duisburg-Essen será a primeira a implementar o roteiro. "Aqui estudamos a forma como os rios respondem a factores de stress, como poluentes ou espécies invasoras. Já recolhemos mais de 34 terabytes de dados de sequências - não só para organismos individuais, mas também para comunidades inteiras. Com este nível de densidade de dados, o RESIST é o banco de ensaio perfeito para estabelecer a nova rotina no tratamento de dados de investigação", afirma Probst.

Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Inglês pode ser encontrado aqui.

Publicação original

Outras notícias do departamento ciência

Notícias mais lidas

Mais notícias de nossos outros portais