Acelerar la alineación de secuencias en el árbol de la vida

Un motor de búsqueda de secuencias para una nueva era de la genómica de la conservación

09.04.2021 - Alemania

Anuncios

Perfilado Metabólico Espacial

Primer agitador incubador de CO₂ con esterilización integrada a 180°C

Máxima capacidad de unión en cromatografía de intercambio iónico

Un equipo de investigadores de los Institutos Max Planck de Biología del Desarrollo de Tubinga y de la Instalación de Computación y Datos Max Planck de Garching desarrolla nuevas capacidades de búsqueda que permitirán comparar la composición bioquímica de diferentes especies de todo el árbol de la vida. Su combinación de precisión y velocidad no tiene rival hasta ahora.

Los seres humanos compartimos muchas secuencias de nucleótidos que componen nuestros genes con otras especies, en particular con los cerdos, pero también con los ratones e incluso con los plátanos. En consecuencia, algunas proteínas de nuestro cuerpo -cadenas de aminoácidos ensambladas según el plano de los genes- también pueden ser iguales (o similares) a algunas proteínas de otras especies. Estas similitudes pueden indicar a veces que dos especies tienen una ascendencia común, o simplemente pueden surgir si la necesidad evolutiva de una determinada característica o función molecular surge por casualidad en las dos especies.

Superar el estándar de oro de la investigación genómica comparativa

Pero, por supuesto, averiguar lo que se comparte con un cerdo o un plátano puede ser una tarea monumental; la búsqueda de una base de datos con toda la información sobre usted, el cerdo y el plátano es bastante complicada desde el punto de vista computacional. Los investigadores esperan que los genomas de más de 1,5 millones de especies eucariotas -que incluyen todos los animales, plantas y hongos- estén secuenciados en la próxima década. "Incluso ahora, con sólo cientos de miles de genomas disponibles (que representan en su mayoría pequeños genomas de bacterias y virus), ya estamos ante bases de datos con hasta 370 millones de secuencias. La mayoría de las herramientas de búsqueda actuales serían sencillamente impracticables y llevarían demasiado tiempo para analizar datos de la magnitud que esperamos en un futuro próximo", explica Hajk-Georg Drost, jefe del grupo de Biología Computacional del Departamento de Biología Molecular del Instituto Max Planck de Biología del Desarrollo de Tubinga.
"Durante mucho tiempo, el patrón de oro para este tipo de análisis solía ser una herramienta llamada BLAST", recuerda Drost. "Si intentabas rastrear cómo se mantenía una proteína por selección natural o cómo se desarrollaba en diferentes linajes filogenéticos, BLAST te daba las mejores coincidencias a esta escala. Pero es previsible que en algún momento las bases de datos crezcan demasiado para realizar búsquedas exhaustivas con BLAST".

Encontrar la aguja en el pajar - ¡pero rápido!

En el centro del problema se encuentra el equilibrio entre velocidad y sensibilidad: al igual que se pierden algunos huevos de Pascua pequeños o bien escondidos si se escanea brevemente una habitación, acelerar la búsqueda de similitudes de secuencias de proteínas en una base de datos suele conllevar la desventaja de perder algunas de las coincidencias menos obvias.
"Por eso, hace algún tiempo, empezamos a idear el algoritmo DIAMOND, con la esperanza de que nos permitiera tratar con grandes conjuntos de datos en un tiempo razonable", recuerda Benjamin Buchfink, colaborador y estudiante de doctorado en el grupo de investigación de Drost que lleva desarrollando DIAMOND desde 2013. "Lo hizo, pero también vino con una desventaja: no podía recoger algunas de las relaciones evolutivas más distantes". Eso significa que mientras el DIAMOND original puede haber sido lo suficientemente sensible como para detectar una determinada secuencia de aminoácidos humanos en un chimpancé, puede haber sido ciego a la ocurrencia de una secuencia similar en una especie evolutivamente más remota.

Una poderosa herramienta para futuras investigaciones

Aunque es útil para estudiar material extraído directamente de muestras ambientales, otros objetivos de investigación requieren herramientas más sensibles que el algoritmo de búsqueda original de DIAMOND. El equipo de investigadores de Tubinga y Garching ha podido modificar y ampliar DIAMOND para que sea tan sensible como BLAST y mantenga su velocidad superior: con el DIAMOND mejorado, los investigadores podrán realizar investigaciones genómicas comparativas con la precisión de BLAST a una velocidad computacional entre 80 y 360 veces superior. "Además, DIAMOND permite a los investigadores realizar alineaciones con una sensibilidad similar a la de BLAST en un superordenador, en un clúster de computación de alto rendimiento o en la Nube de forma verdaderamente masiva y paralela, haciendo posible alineaciones de secuencias a gran escala en un tiempo manejable", añade Klaus Reuter, colaborador del Max Planck Computing and Data Facility". Algunas consultas que con otras herramientas habrían tardado dos meses en un superordenador pueden realizarse en varias horas con la nueva infraestructura de DIAMOND. "Teniendo en cuenta el crecimiento exponencial del número de genomas disponibles, la velocidad y la precisión de DIAMOND son exactamente lo que la genómica moderna necesitará para aprender de toda la colección de todos los genomas, en lugar de tener que centrarse sólo en un número menor de especies concretas por falta de capacidad de búsqueda sensible", predice Drost. El equipo está pues convencido de que todas las ventajas de DIAMOND se harán patentes en los próximos años.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

"Sensitive tree-of-life scale protein alignments using DIAMOND"; Nature Methods; Apr. 7 2021,

https://www.bionity.com/es/noticias/1170554/acelerar-la-alineacion-de-secuencias-en-el-arbol-de-la-vida.html

Publicación original

"Sensitive tree-of-life scale protein alignments using DIAMOND"; Nature Methods; Apr. 7 2021,

Temas

genomas genomica bancos de datos buscadores análisis del genoma secuenciación

Ver todos

Organizaciones

MPI für Entwicklungsbiologie Max-Planck-Gesellschaft

Anuncios

Purificación más eficaz de biomoléculas mediante cromatografía multicolumna

Cuantificación avanzada de virus para el control de procesos en tiempo real

Tecnología TFF avanzada para mejorar la concentración y el procesamiento de anticuerpos monoclonales

Tan cerca que
incluso las moléculas
se vuelven rojas...

Fabricante de espectrómetros NIR

Más del departamento ciencias Suscribirse al boletín

Acelerar la alineación de secuencias en el árbol de la vida

Un motor de búsqueda de secuencias para una nueva era de la genómica de la conservación

Superar el estándar de oro de la investigación genómica comparativa

Encontrar la aguja en el pajar - ¡pero rápido!

Una poderosa herramienta para futuras investigaciones

Publicación original

LifeSpan Vision Ventures invierte en Matter Bio

Más noticias del departamento ciencias

Investigadores de Marburgo descifran la secuencia de una de las enzimas más grandes de la naturaleza

Un nuevo método CRISPR permite controlar la producción de proteínas en las células

Bloqueadores patológicos en lugar de antibióticos

Producción ecológica sostenible a partir de bagazo de cerveza

Las ondas ultrasónicas abren las jaulas supramoleculares y liberan el fármaco anticancerígeno cisplatino

Forzar la muerte de las células cancerosas al tiempo que se activa el sistema inmunitario

Las máquinas moleculares programables están cada vez más cerca

Se dan a conocer los ganadores del Premio Europeo al Inventor 2026

El olfato de los perros y la inteligencia artificial aportan nuevas pistas sobre el «COVID prolongado»

¿Los sustitutos del azúcar afectan a la salud intestinal y al metabolismo?

La LMU de Múnich y Life Science Factory unen fuerzas para impulsar la innovación en el sector biotecnológico

Antes de que la memoria se desvanezca: los científicos descubren un posible indicio de alerta temprana del Alzheimer

Los PFAS presentes en los medicamentos suelen poder sustituirse por alternativas

Contenedores para el cultivo de setas en el campus de investigación: Fraunhofer pone a prueba la producción urbana de alimentos

El microcosmos de la esponja de cocina: la contaminación bacteriana no siempre se ve, se huele ni se nota al tacto

Un avance decisivo en el diseño de enzimas a medida

Tinción virtual de tejidos en 3D

La «huella digital» hospitalaria ayuda a la IA a detectar diagnósticos erróneos en tejido canceroso

El altramuz como fuente de proteínas en productos de panadería y sustitutos de la carne: ¿existe riesgo de alergia?

Como un cohete lunar en miniatura: unos investigadores desarrollan un nanorrobot modular

Noticias más leídas

Menos experimentos con animales gracias al ratón virtual

¿Los sustitutos del azúcar afectan a la salud intestinal y al metabolismo?

Gigantes dormidos: cómo los virus ocultos despiertan en el interior de las algas y se transmiten a las generaciones futuras

Puede que no se trate sólo de lo que contienen los alimentos ultraprocesados, sino de cómo se elaboran

El microcosmos de la esponja de cocina: la contaminación bacteriana no siempre se ve, se huele ni se nota al tacto

La IA acelera las simulaciones moleculares 10 000 veces

Inducción de la muerte celular en las células cancerosas del páncreas

La IA diagnostica tumores cerebrales en cuestión de minutos, en lugar de semanas

Probióticos en lugar de antibióticos en la ganadería

Un nuevo fármaco podría frenar el desarrollo del Alzheimer

Un vaso diario de zumo 100% de fruta podría contribuir al bienestar mental

Más noticias de nuestros otros portales

Según el informe, una de cada cinco tazas de café contiene residuos tóxicos de pesticidas

Friesland-Campina amplía la capacidad de producción de su planta de mantequilla en Lochem

Sensores cuánticos para detectar fraudes alimentarios directamente en el supermercado

Tan cerca que incluso las moléculas se vuelven rojas...

Tan cerca que
incluso las moléculas
se vuelven rojas...