Un nuovo sistema di intelligenza artificiale estrae dati numerici da testi accademici, liberando i ricercatori da compiti di routine

Il framework Quinex struttura automaticamente i dati quantitativi ed è progettato per aiutare a gestire la crescente mole di dati

21.04.2026

Immagine simbolica

AI-generated image

Annunci

ERP ottimizzato per il settore delle scienze della vita

Filtrazione a flusso tangenziale monouso su scala commerciale per il bioprocesso automatizzato

Quantificazione avanzata dei virus per il controllo dei processi in tempo reale

I numeri sono il linguaggio della scienza, ma negli articoli di ricerca sono spesso nascosti nel testo e difficili da analizzare. I ricercatori della Jülich hanno sviluppato un sistema di intelligenza artificiale che identifica automaticamente questi numeri, li categorizza e li converte in dati strutturati. Il framework Quinex elimina così la necessità di un lungo lavoro manuale.

Che si tratti di ricerca sull'energia, sul clima o sui materiali, i documenti scientifici sono pieni di numeri o, più precisamente, di dati quantitativi: efficienze, temperature, costi, emissioni. Questi dati sono spesso fondamentali per migliorare i modelli o identificare le tendenze. Allo stesso tempo, il numero di pubblicazioni scientifiche è in rapida crescita. Per molte domande di ricerca, oggi è praticamente impossibile valutare manualmente tutte le pubblicazioni pertinenti: il tempo e le risorse necessarie sarebbero enormi.

Il framework Quinex ("Quantitative Information Extraction"), sviluppato dai ricercatori di Jülich, si basa su modelli linguistici e automatizza questo processo: L'intelligenza artificiale identifica i valori numerici, li assegna alle unità di misura appropriate e riconosce cosa è stato misurato, quando, dove e come. In questo modo, una frase come "Per il 2025 si ipotizzano livelli di efficienza compresi tra il 63 e il 71%" viene trasformata in un set di dati strutturato contenente tutte le informazioni contestuali rilevanti, dall'anno e dal metodo di misurazione alla fonte.

IA aperta ed efficiente

A differenza di molte soluzioni di AI proprietarie, Quinex si basa interamente su modelli linguistici aperti, relativamente piccoli e quindi efficienti. Questi sono stati specificamente addestrati per riconoscere e classificare le informazioni quantitative nei testi scientifici. Rispetto a sistemi simili, Quinex fornisce risultati più precisi, cattura le informazioni contestuali in modo più sfumato e tiene conto anche delle caratteristiche implicite.

Nonostante le dimensioni compatte, Quinex raggiunge un'accuratezza di riconoscimento (F1) di circa il 98% per i numeri e le unità associate, e di circa l'87 e l'82% per la classificazione di proprietà ed entità quantificate. Questi alti tassi di precisione sono stati raggiunti grazie a set di dati di addestramento appositamente creati e a miglioramenti metodologici.

"Volevamo sviluppare uno strumento potente, ma anche trasparente ed efficiente dal punto di vista delle risorse", spiega il Dr. Jann Weinand, responsabile del Dipartimento Scenari Integrati di Jülich System Analysis. "Quinex rende l'intelligenza artificiale più accessibile per l'analisi dei dati in ambito scientifico".

Un test pratico di successo

Per testare l'idoneità pratica di Quinex, il sistema è stato applicato a migliaia di abstract scientifici di vari settori. Ha estratto con successo dati sui costi di produzione dell'elettricità per varie tecnologie energetiche, sul massimo assorbimento di ossigeno negli esseri umani, sulla magnitudo e sulla localizzazione dei terremoti e sulle lacune di banda dei materiali fotovoltaici.

I valori ricavati automaticamente corrispondono perfettamente ai rispettivi dati di riferimento. Ciò dimostra che Quinex è adatto ad analizzare grandi volumi di letteratura accademica in un'ampia gamma di campi di ricerca e a ricavarne tendenze affidabili.

Nuove prospettive per la ricerca

"I modelli linguistici aprono nuove prospettive per la scienza e aiutano a mantenere una visione d'insieme di interi campi di ricerca", afferma l'autore principale Jan Göpfert. "Consentono di effettuare ricerche automatizzate sulla letteratura, di creare database di ricerca strutturati in modo uniforme e di effettuare analisi delle tendenze che rivelano tempestivamente gli sviluppi della scienza e della tecnologia".

"Il nostro obiettivo è quello di sollevare i ricercatori dal lavoro di routine", afferma il Dr. Patrick Kuckertz, responsabile del Research Data Management Group. "Quinex è stato progettato per aiutarli a raggiungere più rapidamente le intuizioni e a gestire la crescente mole di dati in ambito scientifico".

Limiti e miglioramenti futuri

Quinex non è del tutto privo di errori, ma la trasparenza fa parte del suo design. "Il sistema riconosce i numeri e le unità di misura in modo molto affidabile", afferma Jan Göpfert. Poiché sono presi direttamente dal testo, non possono essere "allucinati". Tuttavia, a volte si verificano interpretazioni errate, ad esempio quando i riferimenti importanti sono sparsi nel testo".

Pertanto, Quinex rimane uno strumento che supporta le persone, ma non le sostituisce. "Raccomandiamo di usare Quinex quando informa e alleggerisce i ricercatori, ma la responsabilità di interpretare i risultati rimane loro", afferma Göpfert. Ogni numero riconosciuto può essere ricondotto alla sua fonte e, ove possibile, viene evidenziato nel testo originale.

Il team sta lavorando per sviluppare ulteriormente Quinex con ulteriori set di dati e modelli specifici per il dominio, rendendolo ancora più efficiente e flessibile per adattarsi alle varie esigenze di ricerca.

Benvenuti nella collaborazione aperta

Il Forschungszentrum Jülich rende disponibile Quinex come progetto open-source.

L'obiettivo è quello di dare ai ricercatori di tutto il mondo l'opportunità di testare, espandere e adattare il sistema ai propri settori, dalla ricerca energetica alla chimica e alla biomedicina.

Nota: questo articolo è stato tradotto utilizzando un sistema informatico senza intervento umano. LUMITOS offre queste traduzioni automatiche per presentare una gamma più ampia di notizie attuali. Poiché questo articolo è stato tradotto con traduzione automatica, è possibile che contenga errori di vocabolario, sintassi o grammatica. L'articolo originale in Inglese può essere trovato qui.

Pubblicazione originale

Jan Göpfert, Patrick Kuckertz, Gian Müller, Luna Lütz, Celine Körner, Hang Khuat, Detlef Stolten, Jann Michael Weinand; "Quinex: Quantitative information extraction from text using open and lightweight LLMs"; The Innovation

https://www.bionity.com/it/notizie/1188534/un-nuovo-sistema-di-intelligenza-artificiale-estrae-dati-numerici-da-testi-accademici-liberando-i-ricercatori-da-compiti-di-routine.html

Pubblicazione originale

Temi

analisi dei dati letteratura tecnica analisi dei dati

Mostra tutti

Organizzazioni

Forschungszentrum Jülich

Link correlato

https://github.com/FZJ-IEK3-VSA/quinex

Annunci

La cromatografia digitale a membrana apre nuovi orizzonti nell'analisi delle proteine

Filtrazione di grado sterilizzante ad alte prestazioni per solventi e formulazioni oleose

Soluzioni di filtrazione a flusso tangenziale ad alte prestazioni per il trattamento biofarmaceutico

Altro dal dipartimento scienza Iscriviti alla newsletter

Un nuovo sistema di intelligenza artificiale estrae dati numerici da testi accademici, liberando i ricercatori da compiti di routine

Il framework Quinex struttura automaticamente i dati quantitativi ed è progettato per aiutare a gestire la crescente mole di dati

IA aperta ed efficiente

Un test pratico di successo

Nuove prospettive per la ricerca

Limiti e miglioramenti futuri

Benvenuti nella collaborazione aperta

Pubblicazione originale

Altre notizie dal dipartimento scienza

La vitamina B3 per l’intestino: dalla scoperta scientifica alla applicazione clinica

Cancro della pelle sul viso: l'ecografia mostra fino a che profondità si estende il tumore

Una simbiosi unica conferisce ai protozoi il senso magnetico

Come le cellule degli anemoni di mare si riuniscono per formare nuovamente un organismo

I moscerini della frutta in modalità difensiva: come le cellule immunitarie intrappolano vivi i parassiti

Una pompa ispirata alla fisarmonica apre una nuova era per la tecnologia "lab-on-a-chip"

Europa: leggi contraddittorie minacciano la biodiversità e la sicurezza alimentare

Il Premio Klaus Grohe 2026 è stato assegnato per la prima volta a due ricercatori

La scatola nera degli orologi epigenetici

Idee geniali: dalla separazione cellulare senza stress al vaccino universale contro l’influenza

La natura come modello per lo stoccaggio sostenibile dell'idrogeno

Il Premio Eppendorf per giovani ricercatori europei 2026 è stato assegnato a Martin Pačesa dell’Università di Zurigo

Arrostiti e dorati: come i batteri intestinali scompongono gli alimenti cotti

Come i batteri si sacrificano per rendere inefficaci gli antibiotici

L'intelligenza artificiale riconosce le cellule tumorali e valuta l'affidabilità della diagnosi

La personalità del fondatore determina il modo in cui le start-up affrontano le crisi

Il visugromab supera la resistenza all’immunoterapia antitumorale

Successo della ricerca verso un nuovo antibiotico di riserva

Scoperta casuale: la fotosintesi ossigenica è possibile con un solo fotosistema

Micelio fungino al posto della resina epossidica: sviluppato un circuito stampato compostabile

Le notizie più lette

Un composto di rame già noto mostra efficacia contro i depositi proteici tipici dell'Alzheimer

I mini-cervelli ricavati dalle cellule dei pazienti indicano la vitamina B3 come trattamento per una rara malattia infantile

Leica Biosystems acquisirà StatLab

Merck amplia il proprio portafoglio nel settore delle scienze della vita con l'acquisizione di Bio-Techne per 11,3 miliardi di dollari

Quali università formano i fondatori di start-up di maggior successo nella regione DACH?

I PFAS presenti nei farmaci possono spesso essere sostituiti con alternative

ARScience Biotherapeutics nomina Gustavo Mahler amministratore delegato

Il premio “Future Insight” 2026 va a Vasilis Ntziachristos di Spear’s

Medios ottimizza la propria rete produttiva e chiude lo stabilimento di Aschaffenburg

Lonza amplia la capacità produttiva di HPAPI a Visp

Antares Therapeutics e Novartis stanno collaborando per individuare, sviluppare e commercializzare nuovi trattamenti contro il cancro

Brenntag Pharma sigla una partnership strategica con Evonik

Altre notizie dagli altri portali

BASF cede la propria divisione vernici a Carlyle per 7,7 miliardi di euro

Secondo il rapporto, una tazza di caffè su cinque contiene residui tossici di pesticidi

Il Premio Wolf 2026 va a un chimico berlinese

Lantmännen prevede 5 milioni di tonnellate di cereali per il 2026

Questo materiale ricava acqua potabile dall'aria e raffredda in modo più efficiente rispetto ai sistemi attuali

Friesland-Campina amplia la capacità produttiva dello stabilimento di produzione del burro di Lochem

Idrogeno rinnovabile dalla Danimarca per l’Europa

Planteneers apre nuove strade verso il "clean label" nel settore delle alternative vegetali

L'Europa dipende fortemente dalle importazioni di litio: il consorzio LiSA punta a cambiare questa situazione

La farina di alghe brune migliora il valore nutrizionale e la digeribilità dei biscotti senza glutine

Scenari per una nuova “era del ferro”: il ferro affianca l’idrogeno come fonte energetica

Vion raggiunge un accordo per la vendita della divisione Food Service - Vion Food Group

Covestro prevede di investire in un nuovo impianto di produzione di MDI su scala mondiale in Cina e avvia uno studio di fattibilità negli Emirati Arabi Uniti

Perché le innovazioni in agricoltura spesso hanno effetto solo gradualmente

Il futuro della chimica nasce in laboratorio: exære vince la From Lab to Market Challenge 2026

8 milioni di euro per i materiali del futuro

Fertilizzanti a chilometro zero: dove vale la pena impiantare fabbriche di ammoniaca di prossimità