La investigación genómica es cada vez más rápida: una herramienta de IA identifica genes en organismos recién secuenciados, sin pruebas de laboratorio
"Es como reconocer de repente párrafos, capítulos y palabras sueltas en un libro completamente desconocido"
Investigadores del Forschungszentrum Jülich y la Universidad Heinrich Heine de Düsseldorf han desarrollado una herramienta que podría transformar significativamente la investigación del genoma: Helixer identifica genes directamente a partir de secuencias de ADN, sin experimentos de laboratorio ni conocimientos previos sobre el organismo.
Antes de que los biólogos puedan decir nada sobre las características genéticas de un organismo, primero deben saber dónde se encuentran los genes dentro de la larga cadena de letras de ADN. Este proceso, conocido como anotación de genes, es uno de los pasos más difíciles del análisis genómico. Hasta ahora, se necesitaban muchos datos experimentales o especies afines bien estudiadas para compararlos. Helixer simplifica y acelera enormemente este trabajo. La IA detecta las características típicas de un gen -señales de inicio y fin, así como elementos estructurales como exones e intrones- directamente a partir de la secuencia.
"Es como reconocer de repente párrafos, capítulos y palabras sueltas en un libro completamente desconocido", explica Marie Bolger, del Instituto de Bioinformática de Jülich (IBG-4). "Esto hace que la investigación del genoma sea mucho más rápida - y posible en absoluto para muchas especies".
Helixer es la primera herramienta de IA capaz de identificar genes de forma fiable en grupos de organismos tan diversos, desde plantas y hongos hasta insectos y vertebrados. Cada año se secuencian miles de genomas en todo el mundo, muchos de ellos de especies que apenas se han estudiado. Para estos casos, Helixer puede ofrecer ahora información genética inmediatamente utilizable que antes requería meses de trabajo.
La IA predice los límites de los genes, alcanzando casi la calidad de las anotaciones de referencia curadas manualmente, y lo hace sin utilizar datos adicionales. En vertebrados, Helixer demuestra un alto nivel de precisión y supera sistemáticamente a las herramientas de predicción de genes establecidas en una amplia gama de especies. Gracias al aprendizaje profundo, las predicciones de la estructura génica de Helixer muestran un rendimiento notablemente superior, sobre todo en el caso de las plantas.
El equipo de investigación ya había presentado el concepto de Helixer en 2020 y desde entonces lo ha desarrollado hasta convertirlo en una herramienta que logra resultados utilizables. Otra herramienta de anotación genética basada en el aprendizaje profundo de la Universidad de Greifswald, Tiberius, que se lanzó en 2024, logra actualmente resultados aún mejores para las especies de mamíferos, pero se limita a este grupo taxonómico.
Nuevo impulso para el campo de la investigación
"Pudimos demostrar que Helixer funciona en una amplia gama de organismos, lo que es crucial para su uso en el fitomejoramiento, la biotecnología y la investigación medioambiental", subraya Bolger. "Estos avances en la anotación de genes impulsada por la IA son realmente emocionantes para este campo".
La secuenciación del genoma se automatizó hace más de 20 años, generando una enorme riqueza de datos. La anotación de genes, en cambio, se consideró durante mucho tiempo un cuello de botella en el análisis del genoma. Ahora se está poniendo al día.
"Durante casi dos décadas no hubo enfoques fundamentalmente nuevos en este campo", afirma Björn Usadel, Director del Instituto de Bioinformática del Forschungszentrum Jülich y Profesor de la Universidad Heinrich Heine de Düsseldorf. "Helixer demuestra que los métodos modernos de IA pueden ayudar a superar este cuello de botella".
Perspectivas
Los resultados, publicados inicialmente como preimpresión en bioRxiv y que ahora aparecen en Nature Methods, ya han sido citados en numerosas ocasiones y han atraído una atención considerable en la comunidad investigadora, señal de la creciente importancia de la herramienta. "Ya estamos viendo que Helixer se utiliza en muchos proyectos, desde plantas de cultivo hasta insectos que dan forma a ecosistemas enteros", afirma Usadel.
Ya están en marcha futuros desarrollos: La estudiante de doctorado Felicitas Kindel, del IBG-4, está explorando estrategias innovadoras para aprovechar los puntos fuertes de Helixer y ampliar sus capacidades.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.
Publicación original
Felix Holst, Anthony M. Bolger, Felicitas Kindel, Christopher Günther, Janina Maß, Sebastian Triesch, Niklas Kiel, Nima Saadat, Oliver Ebenhöh, Björn Usadel, Rainer Schwacke, Andreas P. M. Weber, Marie E. Bolger, Alisandra K. Denton; "Helixer: ab initio prediction of primary eukaryotic gene models combining deep learning and a hidden Markov model"; Nature Methods, 2025-11-24