Un modelo de IA predice los riesgos de enfermedad con décadas de antelación

Una nueva herramienta de IA puede predecir el riesgo y el momento de aparición de más de 1.000 enfermedades

19.09.2025
AI-generated image

Imagen simbólica

Científicos del Laboratorio Europeo de Biología Molecular (EMBL) y del Centro Alemán de Investigación Oncológica (DKFZ) han desarrollado un modelo de IA que evalúa el riesgo individual a largo plazo de más de 1.000 enfermedades. El modelo, que se entrenó y probó utilizando datos médicos anónimos del Reino Unido y Dinamarca, puede predecir eventos de salud a lo largo de un periodo de más de una década. El modelo, presentado en la revista Nature, aún no está listo para su uso clínico, pero ya abre nuevas posibilidades para el desarrollo de estrategias sanitarias.

¿Se puede utilizar el historial médico personal para predecir los problemas de salud a los que nos podemos enfrentar en las próximas dos décadas? Investigadores del EMBL, el DKFZ y la Universidad de Copenhague han demostrado que es posible. Han desarrollado un modelo generativo de IA que utiliza registros sanitarios a gran escala para estimar cómo puede cambiar la salud humana con el paso del tiempo. Puede pronosticar el riesgo y el momento de aparición de más de 1.000 enfermedades y predecir resultados sanitarios con más de una década de antelación.

Este nuevo modelo generativo de IA se ha creado a medida utilizando conceptos algorítmicos similares a los utilizados en los grandes modelos lingüísticos (LLM). Se entrenó con datos anónimos de 400.000 pacientes del Biobanco del Reino Unido. Los investigadores también probaron con éxito el modelo con datos de 1,9 millones de pacientes del Registro Nacional de Pacientes de Dinamarca. Este enfoque es una de las demostraciones más completas hasta la fecha de cómo la IA generativa puede modelizar la progresión de enfermedades humanas a escala y probada con datos de dos sistemas sanitarios totalmente separados.

"Nuestro modelo de IA es una prueba de concepto que demuestra que es posible aprender muchos de nuestros patrones de salud a largo plazo y utilizar esta información para generar predicciones significativas", afirma Ewan Birney, del EMBL. "Al modelizar cómo se desarrollan las enfermedades a lo largo del tiempo, podemos empezar a explorar cuándo surgen ciertos riesgos y cuál es la mejor manera de planificar intervenciones tempranas. Es un gran paso hacia enfoques más personalizados y preventivos de la asistencia sanitaria".

La "gramática" de los datos sanitarios

"Al igual que los grandes modelos lingüísticos pueden aprender la estructura de las frases, este modelo de inteligencia artificial aprende la "gramática" de los datos sanitarios para modelar los historiales médicos como secuencias de acontecimientos que se desarrollan a lo largo del tiempo", explica Moritz Gerstung, del DKFZ. Estos eventos incluyen diagnósticos médicos o factores relacionados con el estilo de vida, como el tabaquismo. El modelo aprende a predecir el riesgo de enfermedad a partir del orden en que se suceden los acontecimientos y el tiempo que transcurre entre ellos.

"Los acontecimientos médicos suelen seguir patrones predecibles", explica Tom Fitzgerald, del Instituto Europeo de Bioinformática (EMBL-EBI). "Nuestro modelo de IA aprende esos patrones y puede pronosticar futuros resultados sanitarios. Nos permite explorar lo que podría ocurrir en función del historial médico de una persona y otros factores clave". Fundamentalmente, no se trata de una certeza, sino de una estimación de los riesgos potenciales".

El modelo es adecuado para diversas enfermedades, sobre todo las que presentan patrones de progresión claros y coherentes, como la diabetes, los infartos de miocardio o la septicemia, que es un tipo de envenenamiento de la sangre. Sin embargo, es menos fiable para diagnósticos como las enfermedades infecciosas, que dependen de acontecimientos vitales imprevisibles, o las enfermedades muy raras.

Probabilidades, no certezas

Al igual que las previsiones meteorológicas, este nuevo modelo de IA ofrece probabilidades, no certezas. No predice con exactitud lo que le ocurrirá a una persona, sino que ofrece estimaciones bien calibradas de la probabilidad de que se produzcan determinadas afecciones en un periodo determinado. Por ejemplo, la probabilidad de desarrollar una enfermedad cardiaca en el próximo año. Estos riesgos se expresan como tasas a lo largo del tiempo, de forma similar a la previsión de un 70% de probabilidades de que llueva mañana.

Algunos resultados, como el riesgo de hospitalización tras un acontecimiento importante (por ejemplo, un infarto de miocardio), pueden predecirse con gran fiabilidad, mientras que otros siguen siendo más inciertos. Del mismo modo, las previsiones a corto plazo son más precisas que las a largo plazo.

El ejemplo del infarto

El riesgo de infarto calculado por el modelo de IA para los hombres de entre 60 y 65 años varía entre una probabilidad de 4 por 10.000/año y alrededor de 100 por 10.000/año, dependiendo de los diagnósticos previos y del estilo de vida de los hombres. Las mujeres tienen un riesgo medio de infarto menor, pero una horquilla igualmente amplia.

Además, el riesgo de infarto aumenta con la edad, tanto en hombres como en mujeres. Una evaluación sistemática de estos riesgos calculados en distintos grupos de edad y sexo muestra que se corresponden bien con el número de casos observados en un subconjunto de la cohorte del Biobanco del Reino Unido que no se utilizó para entrenar el modelo.

El modelo está calibrado para producir estimaciones precisas del riesgo a nivel de población, pronosticando la frecuencia con la que se producen determinadas afecciones en grupos de personas. Sin embargo, como cualquier modelo de IA, tiene sus limitaciones. Por ejemplo, como los datos de entrenamiento del modelo, procedentes del Biobanco del Reino Unido, proceden principalmente de personas de entre 40 y 60 años, los episodios de salud en la infancia y la adolescencia están infrarrepresentados. El modelo también contiene sesgos demográficos debidos a lagunas en los datos de entrenamiento, incluida la infrarrepresentación de determinados grupos étnicos.

Aunque el modelo no está listo para su uso clínico, ya podría ayudar a los investigadores a

  • Comprender cómo se desarrollan y progresan las enfermedades a lo largo del tiempo
  • Explorar cómo el estilo de vida y las enfermedades pasadas afectan al riesgo de enfermedad a largo plazo.
  • Simular resultados sanitarios utilizando datos artificiales de pacientes, en situaciones en las que es difícil obtener o acceder a datos del mundo real.

En el futuro, herramientas de IA como la que aquí se describe, entrenadas en conjuntos de datos más representativos, podrían ayudar a los médicos a identificar precozmente a los pacientes de alto riesgo. Con el envejecimiento de la población y el aumento de las enfermedades crónicas, poder prever las necesidades sanitarias futuras podría ayudar a los sistemas sanitarios a planificar mejor y asignar los recursos de forma más eficiente. Pero hacen falta muchas más pruebas, consultas y marcos normativos sólidos antes de que los modelos de IA puedan implantarse en un entorno clínico.

"Este es el principio de una nueva forma de entender la salud humana y la progresión de las enfermedades", afirma Moritz Gerstung, del DKFZ. "Los modelos generativos como el nuestro podrían algún día ayudar a personalizar la atención y anticipar las necesidades sanitarias a escala. Al aprender de grandes poblaciones, estos modelos ofrecen una poderosa lente sobre cómo se desarrollan las enfermedades y, con el tiempo, podrían apoyar intervenciones más tempranas y personalizadas."

Este modelo de IA se entrenó utilizando datos sanitarios anónimos bajo estrictas normas éticas. Los participantes en el Biobanco del Reino Unido dieron su consentimiento informado, y se accedió a los datos daneses de acuerdo con la normativa nacional que exige que los datos permanezcan en Dinamarca. Los investigadores utilizaron sistemas virtuales seguros para analizar los datos sin trasladarlos de un país a otro. Estas salvaguardias ayudan a garantizar que los modelos de IA se desarrollen y utilicen respetando la privacidad y las normas éticas.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Artem Shmatko, Alexander Wolfgang Jung, Kumar Gaurav, Søren Brunak, Laust Mortensen, Ewan Birney, Tom Fitzgerald & Moritz Gerstung: Learning the natural history of human disease with generative transformers; Nature 2025

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales

Todos los fabricantes de autoclaves de un vistazo