A investigação sobre o genoma está a ficar mais rápida: ferramenta de IA identifica genes em organismos recentemente sequenciados - sem testes laboratoriais
"É como reconhecer subitamente parágrafos, capítulos e palavras individuais num livro completamente desconhecido"
Anúncios
Investigadores do Forschungszentrum Jülich e da Universidade Heinrich Heine de Düsseldorf desenvolveram uma ferramenta que poderá transformar significativamente a investigação do genoma: O Helixer identifica genes diretamente a partir de sequências de ADN - sem experiências laboratoriais ou conhecimentos prévios sobre o organismo.
Antes de os biólogos poderem dizer alguma coisa sobre as caraterísticas genéticas de um organismo, têm primeiro de saber onde estão localizados os genes na longa cadeia de letras de ADN. Este processo, conhecido como anotação de genes, é um dos passos mais difíceis na análise do genoma. Até agora, exigia dados experimentais extensos ou espécies relacionadas bem estudadas para comparação. Atualmente, o Helixer simplifica e acelera consideravelmente este trabalho. A IA detecta caraterísticas típicas de um gene - sinais de início e de paragem, bem como elementos estruturais como exões e intrões - diretamente a partir da sequência.
"É como reconhecer subitamente parágrafos, capítulos e palavras individuais num livro completamente desconhecido", explica Marie Bolger do Instituto de Bioinformática de Jülich (IBG-4). "Isto torna a investigação do genoma muito mais rápida - e possível para muitas espécies".
O Helixer é a primeira ferramenta de IA capaz de identificar de forma fiável genes em grupos tão diversos de organismos - desde plantas e fungos a insectos e vertebrados. Todos os anos, são sequenciados milhares de genomas em todo o mundo, muitos deles de espécies que ainda mal foram estudadas. Nestes casos, o Helixer pode agora fornecer informação genética imediatamente utilizável que anteriormente exigia meses de trabalho.
A IA prevê os limites dos genes, atingindo quase a qualidade das anotações de referência com curadoria manual - e fá-lo sem utilizar dados adicionais. Nos vertebrados, o Helixer demonstra um elevado nível de precisão e supera consistentemente as ferramentas de previsão de genes estabelecidas numa vasta gama de espécies. Graças à aprendizagem profunda, as previsões da estrutura genética do Helixer apresentam um desempenho nitidamente superior, em especial no caso das plantas.
A equipa de investigação já tinha apresentado o conceito do Helixer em 2020 e, desde então, desenvolveu-o numa ferramenta que alcança resultados utilizáveis. Outra ferramenta de anotação de genes baseada em aprendizagem profunda da Universidade de Greifswald, o Tiberius, que foi lançado em 2024, obtém atualmente resultados ainda melhores para espécies de mamíferos, mas está limitado a este grupo taxonómico.
Novo impulso para o campo da investigação
"Conseguimos mostrar que o Helixer funciona numa vasta gama de organismos, o que é crucial para a sua utilização no melhoramento de plantas, na biotecnologia e na investigação ambiental", sublinha Bolger. "Estes avanços na anotação de genes com base em IA são verdadeiramente empolgantes para o sector".
A sequenciação do genoma foi automatizada há mais de 20 anos, gerando uma enorme riqueza de dados. A anotação de genes, por outro lado, foi durante muito tempo considerada um estrangulamento na análise do genoma. Agora está a recuperar o atraso.
"Durante quase duas décadas, não houve abordagens fundamentalmente novas neste domínio", afirma Björn Usadel, Diretor do Instituto de Bioinformática do Forschungszentrum Jülich e Professor da Universidade Heinrich Heine de Düsseldorf. "O Helixer mostra que os métodos modernos de IA podem ajudar a ultrapassar este estrangulamento."
Perspectivas
Os resultados, inicialmente publicados como uma pré-impressão no bioRxiv e agora publicados na Nature Methods, já foram citados muitas vezes e atraíram uma atenção substancial na comunidade científica - um sinal da importância crescente da ferramenta. "Já estamos a ver o Helixer a ser utilizado em muitos projectos - desde plantas cultivadas a insectos que moldam ecossistemas inteiros", diz Usadel.
Os desenvolvimentos futuros já estão em curso: A estudante de doutoramento Felicitas Kindel, do IBG-4, está a explorar estratégias inovadoras para aproveitar os pontos fortes do Helixer e alargar as suas capacidades.
Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Inglês pode ser encontrado aqui.
Publicação original
Felix Holst, Anthony M. Bolger, Felicitas Kindel, Christopher Günther, Janina Maß, Sebastian Triesch, Niklas Kiel, Nima Saadat, Oliver Ebenhöh, Björn Usadel, Rainer Schwacke, Andreas P. M. Weber, Marie E. Bolger, Alisandra K. Denton; "Helixer: ab initio prediction of primary eukaryotic gene models combining deep learning and a hidden Markov model"; Nature Methods, 2025-11-24