Normas justas para compartir datos de secuencias: nueva hoja de ruta en Nature Microbiology
Combinar apertura y equidad en las ciencias de la vida con gran volumen de datos
Los conjuntos de datos de ADN y ARN en repositorios públicos crecen a un ritmo sin precedentes, creando un atlas mundial de la diversidad microbiana. Aunque el acceso abierto sigue impulsando la investigación, también plantea un dilema: los datos recogidos con tanto esfuerzo suelen estar disponibles en todo el mundo antes de que los investigadores que los generaron puedan publicar sus propios hallazgos. En respuesta, un consorcio internacional de más de 230 científicos, dirigido por el profesor Alexander Probst, de la Universidad de Duisburg-Essen, ha publicado en Nature Microbiology una hoja de ruta para promover un manejo más justo de los datos públicos de secuencias.
"Los datos abiertos son el combustible de la ciencia moderna, especialmente en la era del Big Data y la minería de datos", afirma el profesor Alexander Probst, catedrático de Metagenómica Ambiental de la Universidad de Duisburg-Essen y del Centro de Investigación One Health Ruhr. "Pero recoger, procesar y analizar muestras a menudo lleva meses de trabajo. Esa contribución no debe quedar sin reconocimiento".
El Acuerdo de Fort Lauderdale de 2003 ya exigía que los datos de secuencias de ADN y ARN se pusieran a disposición del público en las 24 horas siguientes a su generación. En aquel momento, los volúmenes eran aún manejables, y el acceso abierto se convirtió rápidamente en un motor del progreso científico.
Hoy, sin embargo, la secuenciación de alto rendimiento produce volúmenes tan enormes que pueden llenar granjas enteras de servidores. En microbiología, esto ha permitido la creación de atlas digitales de la diversidad, construidos a partir de muestras recogidas a menudo durante arduas expediciones y mediante un meticuloso trabajo de laboratorio, con frecuencia llevado a cabo por investigadores noveles. Una vez cargados, estos datos son inmediatamente accesibles en todo el mundo, a menudo mucho antes de que los recolectores originales hayan tenido la oportunidad de publicar sus propios resultados.
Para aliviar esta tensión, el equipo de autoría ha elaborado una hoja de ruta que trata de equilibrar la apertura con la equidad en las ciencias de la vida que hacen un uso intensivo de datos. El acceso abierto sigue siendo el principio rector, pero ahora se complementa con un código de honor que establece normas más claras para la reutilización.
El núcleo de las recomendaciones es la introducción de una "etiqueta de información sobre reutilización de datos (DRI)" para los conjuntos de datos, vinculada al identificador digital de investigador ORCID, que atribuye inequívocamente las contribuciones a una o más personas. Los investigadores que facilitan su identificador están señalando: por favor, póngase en contacto con nosotros antes de reutilizar estos datos. Si el identificador está ausente, los datos se consideran libremente reutilizables. Para el material que no vaya acompañado de una publicación formal, los recopiladores originales de los datos deben participar activamente.
"El acceso abierto sigue siendo esencial", subraya Probst. "El valor de disponer de datos inmediatamente es especialmente evidente en tiempos de pandemia. Sin ella, el rápido desarrollo mundial de vacunas contra el SRAS-CoV-2 difícilmente habría sido posible. Nuestro objetivo ahora es establecer prácticas cotidianas más justas que garanticen que quienes recopilan los datos sean reconocidos e incluidos en los nuevos proyectos".
La hoja de ruta es el resultado de amplios debates con varios centenares de investigadores de todo el mundo. Entre las bases se encuentra una encuesta internacional apoyada por la profesora Anke Heyder (Universidad del Ruhr de Bochum). El estudio fue coordinado por el Profesor Alexander Probst junto con la Dra. Christina Moraru y el Dr. André Soares (ambos de la Universidad de Duisburg-Essen), el Profesor Folker Meyer (Instituto de Inteligencia Artificial en Medicina/Medicina Universitaria de Essen), la Profesora Laura A. Hug (Universidad de Waterloo, Canadá) y el Profesor Roland Hatzenpichler (Universidad Estatal de Montana, EE.UU.).
Dentro del Centro de Investigación Colaborativa RESIST, que apoyó la iniciativa, el equipo de investigación sobre el agua de la Universidad de Duisburg-Essen será el primero en aplicar la hoja de ruta. "Aquí estudiamos cómo responden los ríos a factores de estrés como los contaminantes o las especies invasoras. Ya hemos recopilado más de 34 terabytes de datos de secuencias, no sólo de organismos individuales, sino de comunidades enteras. Con este nivel de densidad de datos, RESIST es el banco de pruebas perfecto para establecer la nueva rutina en el manejo de datos de investigación", afirma Probst.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.
Publicación original
Laura A. Hug, Roland Hatzenpichler, Cristina Moraru, André R. Soares, Folker Meyer, Anke Heyder, , R. Z. Abdallah, A. Abdalrahem, N. Abdulkadir, I. M. Adesiyan, L. Alteio, K. Anantharaman, R. Anderson, A-S. Andrei, J. A. Baeza, F. Bak, B. Baker, ...T. A. Williams, A. Z. Worden, T. Woyke, M. Wu, W. Xiu, Y. Zhang, J. Zhu, R. M. Ziels, B. Zwirzitz, Alexander J. Probst; "A roadmap for equitable reuse of public microbiome data"; Nature Microbiology, 2025-9-26