Un modello di intelligenza artificiale prevede i rischi di malattia con decenni di anticipo
Un nuovo strumento di intelligenza artificiale può prevedere il rischio e la tempistica di oltre 1.000 malattie
Annunci
Gli scienziati del Laboratorio europeo di biologia molecolare (EMBL) e del Centro tedesco di ricerca sul cancro (DKFZ) hanno sviluppato un modello di intelligenza artificiale che valuta il rischio individuale a lungo termine per oltre 1.000 malattie. Il modello, che è stato addestrato e testato utilizzando dati medici anonimizzati provenienti dal Regno Unito e dalla Danimarca, è in grado di prevedere eventi di salute per un periodo di oltre un decennio. Il modello, presentato sulla rivista Nature, non è ancora pronto per l'uso clinico, ma apre già nuove possibilità per lo sviluppo di strategie sanitarie.
È possibile utilizzare la propria storia clinica personale per prevedere i problemi di salute che si potrebbero incontrare nei prossimi due decenni? I ricercatori dell'EMBL, del DKFZ e dell'Università di Copenhagen hanno dimostrato che è possibile. Hanno sviluppato un modello generativo di intelligenza artificiale che utilizza registri sanitari su larga scala per stimare come la salute umana possa cambiare nel tempo. È in grado di prevedere il rischio e la tempistica di oltre 1.000 malattie e di prevedere gli esiti della salute con oltre un decennio di anticipo.
Questo nuovo modello generativo di intelligenza artificiale è stato costruito su misura utilizzando concetti algoritmici simili a quelli utilizzati nei modelli linguistici di grandi dimensioni (LLM). È stato addestrato su dati di pazienti anonimizzati provenienti da 400.000 partecipanti della Biobanca del Regno Unito. I ricercatori hanno anche testato con successo il modello utilizzando i dati di 1,9 milioni di pazienti del registro nazionale danese. Questo approccio è una delle dimostrazioni più complete finora realizzate di come l'IA generativa possa modellare la progressione delle malattie umane su scala e testata su dati provenienti da due sistemi sanitari completamente separati.
"Il nostro modello di IA è una prova di concetto, che dimostra come sia possibile apprendere molti dei nostri modelli di salute a lungo termine e utilizzare queste informazioni per generare previsioni significative", ha dichiarato Ewan Birney dell'EMBL. "Modellando il modo in cui le malattie si sviluppano nel tempo, possiamo iniziare a studiare quando emergono certi rischi e come pianificare al meglio gli interventi precoci. È un grande passo avanti verso approcci più personalizzati e preventivi all'assistenza sanitaria".
La "grammatica" dei dati sanitari
"Proprio come i grandi modelli linguistici possono imparare la struttura delle frasi, questo modello di intelligenza artificiale impara la "grammatica" dei dati sanitari per modellare le storie mediche come sequenze di eventi che si svolgono nel tempo", spiega Moritz Gerstung, DKFZ. Questi eventi includono diagnosi mediche o fattori legati allo stile di vita, come il fumo. Il modello impara a prevedere il rischio di malattia in base all'ordine in cui si verificano tali eventi e al tempo che intercorre tra di essi.
"Gli eventi medici spesso seguono schemi prevedibili", ha dichiarato Tom Fitzgerald dell'Istituto europeo di bioinformatica (EMBL-EBI). "Il nostro modello di intelligenza artificiale apprende questi schemi e può prevedere gli esiti futuri della salute. Ci dà modo di esplorare ciò che potrebbe accadere in base alla storia medica di una persona e ad altri fattori chiave. È fondamentale che non si tratti di una certezza, ma di una stima dei rischi potenziali".
Il modello è adatto a diverse malattie, in particolare a quelle che presentano schemi di progressione chiari e coerenti, come il diabete, l'infarto o la setticemia, un tipo di avvelenamento del sangue. Tuttavia, è meno affidabile per diagnosi come le malattie infettive, che dipendono da eventi di vita imprevedibili, o le malattie molto rare.
Probabilità, non certezze
Come le previsioni del tempo, questo nuovo modello di intelligenza artificiale fornisce probabilità, non certezze. Non prevede esattamente cosa accadrà a un individuo, ma offre stime ben calibrate della probabilità che determinate condizioni si verifichino in un determinato periodo. Ad esempio, la possibilità di sviluppare una malattia cardiaca entro l'anno successivo. Questi rischi sono espressi come tassi nel tempo, come una previsione del 70% di probabilità di pioggia domani.
Alcuni esiti, come il rischio di ricovero in ospedale dopo un evento importante - ad esempio un infarto - possono essere previsti con un'elevata fiducia, mentre altri rimangono più incerti. Allo stesso modo, le previsioni su un periodo di tempo più breve hanno un'accuratezza maggiore rispetto a quelle a lungo termine.
L'infarto come esempio
Il rischio di infarto calcolato dal modello AI per gli uomini di età compresa tra i 60 e i 65 anni varia tra una probabilità di 4 su 10.000/anno e circa 100 su 10.000/anno, a seconda delle diagnosi precedenti e dello stile di vita dell'uomo. Le donne hanno un rischio medio di infarto più basso, ma un intervallo altrettanto ampio.
Inoltre, il rischio di infarto aumenta con l'età sia negli uomini che nelle donne. Una valutazione sistematica di questi rischi calcolati in diversi gruppi di età e sesso mostra che corrispondono bene al numero di casi osservati in un sottoinsieme della coorte della UK Biobank che non è stato utilizzato per addestrare il modello.
Il modello è calibrato per produrre stime accurate del rischio a livello di popolazione, prevedendo la frequenza di determinate condizioni all'interno di gruppi di persone. Tuttavia, come ogni modello di intelligenza artificiale, presenta dei limiti. Ad esempio, poiché i dati di addestramento del modello provenienti dalla Biobanca del Regno Unito provengono principalmente da individui di età compresa tra i 40 e i 60 anni, gli eventi sanitari dell'infanzia e dell'adolescenza sono sottorappresentati. Il modello contiene anche pregiudizi demografici dovuti a lacune nei dati di addestramento, tra cui la sottorappresentazione di alcuni gruppi etnici.
Sebbene il modello non sia pronto per l'uso clinico, potrebbe già aiutare i ricercatori:
- capire come le malattie si sviluppano e progrediscono nel tempo
- Esplorare come lo stile di vita e le malattie pregresse influenzino il rischio di malattia a lungo termine
- Simulare gli esiti della salute utilizzando dati artificiali dei pazienti, in situazioni in cui è difficile ottenere o accedere ai dati del mondo reale.
In futuro, strumenti di intelligenza artificiale come quello qui descritto, addestrati su serie di dati più rappresentative, potrebbero aiutare i medici a identificare precocemente i pazienti ad alto rischio. Con l'invecchiamento della popolazione e l'aumento dei tassi di malattie croniche, essere in grado di prevedere i bisogni sanitari futuri potrebbe aiutare i sistemi sanitari a pianificare meglio e ad allocare le risorse in modo più efficiente. Tuttavia, prima che i modelli di IA possano essere impiegati in ambito clinico, sono necessari molti altri test, consultazioni e solidi quadri normativi.
"Questo è l'inizio di un nuovo modo di comprendere la salute umana e la progressione delle malattie", ha dichiarato Moritz Gerstung del DKFZ. "Modelli generativi come il nostro potrebbero un giorno aiutare a personalizzare le cure e ad anticipare le esigenze sanitarie su scala. Apprendendo da ampie popolazioni, questi modelli offrono una lente potente sul decorso delle malattie e potrebbero infine supportare interventi più precoci e personalizzati".
Questo modello di intelligenza artificiale è stato addestrato utilizzando dati sanitari anonimizzati nel rispetto di rigorose regole etiche. I partecipanti alla Biobanca del Regno Unito hanno dato il loro consenso informato e i dati danesi sono stati consultati in conformità con le normative nazionali che prevedono che i dati rimangano all'interno della Danimarca. I ricercatori hanno utilizzato sistemi virtuali e sicuri per analizzare i dati senza spostarli oltre confine. Queste salvaguardie contribuiscono a garantire che i modelli di intelligenza artificiale siano sviluppati e utilizzati nel rispetto della privacy e degli standard etici.
Nota: questo articolo è stato tradotto utilizzando un sistema informatico senza intervento umano. LUMITOS offre queste traduzioni automatiche per presentare una gamma più ampia di notizie attuali. Poiché questo articolo è stato tradotto con traduzione automatica, è possibile che contenga errori di vocabolario, sintassi o grammatica. L'articolo originale in Inglese può essere trovato qui.
Pubblicazione originale
Artem Shmatko, Alexander Wolfgang Jung, Kumar Gaurav, Søren Brunak, Laust Mortensen, Ewan Birney, Tom Fitzgerald & Moritz Gerstung: Learning the natural history of human disease with generative transformers; Nature 2025