Modelo de IA prevê riscos de doença com décadas de antecedência

Nova ferramenta de IA pode prever o risco e o momento de mais de 1000 doenças

19.09.2025
AI-generated image

Imagem simbólica

Cientistas do Laboratório Europeu de Biologia Molecular (EMBL) e do Centro Alemão de Investigação do Cancro (DKFZ) desenvolveram um modelo de IA que avalia o risco individual a longo prazo de mais de 1000 doenças. O modelo, que foi treinado e testado utilizando dados médicos anónimos do Reino Unido e da Dinamarca, pode prever eventos de saúde durante um período de mais de uma década. O modelo, apresentado na revista Nature, ainda não está pronto para uso clínico, mas já abre novas possibilidades para o desenvolvimento de estratégias de saúde.

Poderá o seu historial médico pessoal ser utilizado para prever os problemas de saúde que poderá enfrentar nas próximas duas décadas? Investigadores do EMBL, do DKFZ e da Universidade de Copenhaga demonstraram agora que isso é possível. Desenvolveram um modelo de IA generativo que utiliza registos de saúde em grande escala para estimar a forma como a saúde humana pode mudar ao longo do tempo. Consegue prever o risco e o momento de ocorrência de mais de 1000 doenças e prever os resultados em termos de saúde com mais de uma década de antecedência.

Este novo modelo de IA generativa foi criado por medida utilizando conceitos algorítmicos semelhantes aos utilizados nos modelos de linguagem de grande dimensão (LLM). Foi treinado com dados de doentes anónimos de 400 000 participantes do Biobanco do Reino Unido. Os investigadores também testaram com êxito o modelo utilizando dados de 1,9 milhões de doentes do Registo Nacional de Doentes dinamarquês. Esta abordagem é uma das demonstrações mais abrangentes até à data de como a IA generativa pode modelar a progressão da doença humana à escala e testada em dados de dois sistemas de saúde totalmente separados.

"O nosso modelo de IA é uma prova de conceito, mostrando que é possível aprender muitos dos nossos padrões de saúde a longo prazo e utilizar esta informação para gerar previsões significativas", afirmou Ewan Birney, EMBL. "Ao modelar a forma como as doenças se desenvolvem ao longo do tempo, podemos começar a explorar quando surgem determinados riscos e qual a melhor forma de planear intervenções precoces. É um grande passo em direção a abordagens mais personalizadas e preventivas dos cuidados de saúde".

A "gramática" dos dados de saúde

"Tal como os grandes modelos linguísticos podem aprender a estrutura das frases, este modelo de IA aprende a "gramática" dos dados de saúde para modelar os históricos médicos como sequências de eventos que se desenrolam ao longo do tempo", explica Moritz Gerstung, DKFZ. Estes eventos incluem diagnósticos médicos ou factores relacionados com o estilo de vida, como o tabagismo. O modelo aprende a prever o risco de doença a partir da ordem em que esses eventos ocorrem e do tempo que passa entre eles.

"Os eventos médicos seguem frequentemente padrões previsíveis", afirmou Tom Fitzgerald, do Instituto Europeu de Bioinformática (EMBL-EBI). "O nosso modelo de IA aprende esses padrões e pode prever futuros resultados de saúde. Dá-nos uma forma de explorar o que pode acontecer com base no historial médico de uma pessoa e noutros factores-chave. Crucialmente, não se trata de uma certeza, mas de uma estimativa dos riscos potenciais".

O modelo é adequado para várias doenças, especialmente as que têm padrões de progressão claros e consistentes, como a diabetes, os ataques cardíacos ou a septicemia, que é um tipo de envenenamento do sangue. No entanto, é menos fiável para diagnósticos como as doenças infecciosas, que dependem de acontecimentos de vida imprevisíveis, ou doenças muito raras.

Probabilidades, não certezas

Tal como as previsões meteorológicas, este novo modelo de IA fornece probabilidades, não certezas. Não prevê exatamente o que vai acontecer a um indivíduo, mas oferece estimativas bem calibradas da probabilidade de ocorrência de determinadas doenças num determinado período. Por exemplo, a probabilidade de desenvolver uma doença cardíaca no próximo ano. Estes riscos são expressos como taxas ao longo do tempo, tal como a previsão de uma probabilidade de 70% de chuva amanhã.

Alguns resultados, como o risco de hospitalização após um acontecimento importante - por exemplo, um ataque cardíaco - podem ser previstos com elevada confiança, enquanto outros permanecem mais incertos. Do mesmo modo, as previsões para um período de tempo mais curto são mais exactas do que as previsões a longo prazo.

O ataque cardíaco como exemplo

O risco de ataque cardíaco calculado pelo modelo de IA para homens com idades compreendidas entre os 60 e os 65 anos varia entre uma probabilidade de 4 por 10 000/ano e cerca de 100 por 10 000/ano, consoante os diagnósticos anteriores e o estilo de vida dos homens. As mulheres têm um risco médio mais baixo de ataque cardíaco, mas um intervalo igualmente alargado.

Para além disso, o risco de ataque cardíaco aumenta com a idade, tanto nos homens como nas mulheres. Uma avaliação sistemática destes riscos calculados em diferentes grupos etários e de género mostra que correspondem bem ao número de casos observados num subconjunto da coorte do UK Biobank que não foi utilizado para treinar o modelo.

O modelo está calibrado para produzir estimativas de risco exactas a nível populacional, prevendo a frequência com que certas doenças ocorrem em grupos de pessoas. No entanto, como qualquer modelo de IA, tem limitações. Por exemplo, como os dados de treino do modelo do Biobanco do Reino Unido provêm principalmente de indivíduos com idades compreendidas entre os 40 e os 60 anos, isso significa que os eventos de saúde na infância e na adolescência estão sub-representados. O modelo também contém enviesamentos demográficos devido a lacunas nos dados de treino, incluindo a sub-representação de determinados grupos étnicos.

Embora o modelo não esteja pronto para utilização clínica, já pode ajudar os investigadores a

  • Compreender como as doenças se desenvolvem e progridem ao longo do tempo
  • Explorar a forma como o estilo de vida e as doenças anteriores afectam o risco de doença a longo prazo
  • Simular resultados de saúde utilizando dados artificiais de doentes, em situações em que é difícil obter ou aceder a dados do mundo real

No futuro, ferramentas de IA como a aqui descrita, treinadas em conjuntos de dados mais representativos, poderão ajudar os médicos a identificar precocemente os doentes de alto risco. Com o envelhecimento da população e o aumento das taxas de doenças crónicas, a capacidade de prever as necessidades futuras em matéria de saúde poderá ajudar os sistemas de saúde a planear melhor e a afetar os recursos de forma mais eficiente. Mas são necessários muito mais testes, consultas e quadros regulamentares sólidos antes de os modelos de IA poderem ser implementados num ambiente clínico.

"Este é o início de uma nova forma de compreender a saúde humana e a progressão das doenças", afirmou Moritz Gerstung, do DKFZ. "Modelos generativos como o nosso poderão um dia ajudar a personalizar os cuidados e a antecipar as necessidades de cuidados de saúde à escala. Ao aprender com grandes populações, estes modelos oferecem uma perspetiva poderosa sobre a forma como as doenças se desenvolvem e poderão, eventualmente, apoiar intervenções mais precoces e mais adaptadas."

Este modelo de IA foi treinado utilizando dados de saúde anónimos ao abrigo de regras éticas rigorosas. Os participantes do Biobanco do Reino Unido deram consentimento informado e os dados dinamarqueses foram acedidos de acordo com os regulamentos nacionais que exigem que os dados permaneçam na Dinamarca. Os investigadores utilizaram sistemas virtuais seguros para analisar os dados sem os deslocar para além das fronteiras. Estas salvaguardas ajudam a garantir que os modelos de IA são desenvolvidos e utilizados de forma a respeitar a privacidade e as normas éticas.

Observação: Este artigo foi traduzido usando um sistema de computador sem intervenção humana. A LUMITOS oferece essas traduções automáticas para apresentar uma gama mais ampla de notícias atuais. Como este artigo foi traduzido com tradução automática, é possível que contenha erros de vocabulário, sintaxe ou gramática. O artigo original em Inglês pode ser encontrado aqui.

Publicação original

Artem Shmatko, Alexander Wolfgang Jung, Kumar Gaurav, Søren Brunak, Laust Mortensen, Ewan Birney, Tom Fitzgerald & Moritz Gerstung: Learning the natural history of human disease with generative transformers; Nature 2025

Outras notícias do departamento ciência

Notícias mais lidas

Mais notícias de nossos outros portais