Territorio inexplorado en el genoma humano

18.07.2022 - Alemania

Un consorcio internacional reúne 7.200 segmentos del genoma humano prácticamente inexplorados y presenta en "Nature Biotechnology" una hoja de ruta para integrarlos en bases de datos genómicas. Podrían contener información sobre lo que diferencia a los humanos de otros animales.

Karen Arnott/EMBL-EBI

Territorio inexplorado en el genoma humano

Cuando los investigadores que trabajan en el Proyecto Genoma Humano trazaron el mapa genético de los humanos en 2001, se sorprendieron al encontrar sólo unos 20.000 genes que producen proteínas. ¿Podría ser que los humanos tuvieran sólo el doble de genes que una mosca común? Los científicos esperaban mucho más.

Ahora, investigadores de 20 instituciones de todo el mundo reúnen más de 7.200 segmentos de genes no reconocidos que potencialmente codifican nuevas proteínas. Por primera vez, el estudio hace uso de una nueva tecnología para encontrar posibles proteínas en los seres humanos, observando en detalle la maquinaria de producción de proteínas en las células. El nuevo estudio sugiere que los esfuerzos de descubrimiento de genes del Proyecto Genoma Humano eran sólo el principio, y el consorcio de investigación pretende animar a la comunidad científica a integrar los datos en las principales bases de datos del genoma humano.

El estudio, publicado recientemente en "Nature Biotechnology", ha sido codirigido por el Dr. Jorge Ruiz Orera del Centro Max Delbrück de Medicina Molecular de la Asociación Helmholtz (MDC) en Alemania, el Dr. Sebastiaan van Heesch del Centro Princesa Máxima de oncología pediátrica en los Países Bajos, el Dr. Jonathan Mudge del Laboratorio Europeo de Biología Molecular - Instituto Europeo de Bioinformática (EMBL-EBI) en el Reino Unido, y el Dr. John Prensner del Instituto Broad del MIT y Harvard en los Estados Unidos.

Las nuevas secuencias genéticas quedaron fuera del alcance

En los últimos años se han descubierto en el genoma humano miles de marcos abiertos de lectura (ORF), a menudo muy pequeños. Se trata de tramos de secuencia de ADN que pueden contener instrucciones para construir proteínas. Varios autores del presente estudio ya habían encontrado ORF y los habían descrito en revistas científicas: Van Heesch, junto con los profesores del MDC Norbert Hübner y Uwe Ohler describieron nuevas miniproteínas en el corazón humano e informaron sobre ellas en "Cell" en 2019; Prensner también publicó sobre los ORF en "Nature Biotechnology" en 2021. Sin embargo, ninguno de estos segmentos antes prácticamente inexplorados se incluyó después en las bases de datos de referencia. Otras secuencias se publicaron en revistas como "Science" o "Nature Chemical Biology", pero permanecieron en gran medida fuera del alcance de la mayoría de los miembros de la comunidad científica, a pesar de la evidencia de que producen moléculas de ARN que posteriormente se unen a los ribosomas, las fábricas de proteínas de la célula.

Tradicionalmente, las regiones codificadoras de proteínas en los genes se han identificado comparando secuencias de ADN de múltiples especies: las regiones codificadoras más importantes se han conservado durante la evolución animal. Pero este método tiene un inconveniente: las regiones codificantes que son relativamente jóvenes, es decir, que surgieron durante la evolución de los primates, se pierden y, por tanto, no aparecen en las bases de datos.

Así que ahora la tarea consiste en integrar los ORFs, en gran medida ignorados, en las mayores bases de datos de referencia, ya que hasta ahora los investigadores han tenido que buscarlos específicamente en la literatura si querían estudiarlos.

Como primer paso, el equipo internacional de investigación recopiló información sobre las secuencias que habían sido descubiertas mediante el perfil ribosómico, una técnica que determina con qué parte del ARN mensajero (ARNm) interactúa el ribosoma. A continuación, reunieron los datos en un catálogo estandarizado. No fue una hazaña menor, ya que los datos obtenidos de muy diversas maneras en distintos laboratorios no pueden combinarse sin más.

Una vez conseguido esto, el consorcio internacional se puso a trabajar en cuestiones centrales que definen nuestra propia noción del genoma humano: ¿Qué es un gen? ¿Qué es una proteína? ¿Necesitamos nociones flexibles sobre si los ribosomas producen siempre una proteína o más bien algún otro producto celular?

El grupo pide ahora que se revisen las bases de datos del genoma humano utilizadas por los científicos de todo el mundo. Ensembl-GENCODE están configurando este catálogo de ORF como un componente de su base de datos de anotación de referencia. El enfoque será apoyado por muchas otras como UniProt, HGNC, PeptideAtlas y HUPO.

Los ORF probablemente desempeñan un papel en las enfermedades comunes

El Dr. Sebastiaan van Heesch, jefe de grupo del Centro Princesa Máxima de oncología pediátrica, afirma: "Nuestra investigación supone un enorme paso adelante en la comprensión de la composición genética y el número completo de proteínas en los seres humanos. Es tremendamente emocionante facilitar a la comunidad investigadora nuestro nuevo catálogo. Es demasiado pronto para decir si todas las secciones inexploradas del ADN representan realmente proteínas, pero podemos ver claramente que algo inexplorado está ocurriendo en el genoma humano y que el mundo debería prestar atención."

"Durante demasiado tiempo, la comunidad científica ha permanecido en la oscuridad sobre estos ORF", dice Jonathan Mudge, del EMBL-EBI. "Estamos muy orgullosos de que nuestro trabajo permita a los investigadores de todo el mundo empezar a estudiarlos. Este es el punto en el que entran en la corriente principal de la ciencia genómica y médica, un esfuerzo que esperamos que tenga amplios efectos en cadena."

"Resulta especialmente llamativo que la mayoría de estos 7.200 ORF sean exclusivos de los primates y puedan representar innovaciones evolutivas exclusivas de nuestra especie", informa Jorge Ruiz-Orera, biólogo evolutivo que trabaja en el laboratorio de Hübner en el MDC. "Esto muestra cómo estos elementos pueden proporcionar pistas importantes sobre lo que nos hace humanos".

¿Y qué es lo siguiente? John Prensner, del Instituto Broad del MIT y de Harvard, afirma: "Es casi seguro que estos ORFs serán factores que contribuyan a muchos rasgos y enfermedades humanas, tanto las raras como las comunes, como el cáncer. El reto consiste ahora en averiguar cuáles tienen qué papel en qué enfermedades".

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales

Lucha contra el cáncer: últimos avances y progresos