Un nuovo modello di intelligenza artificiale può prevedere la durata della vita umana, affermano i ricercatori. Vogliono assicurarsi che venga utilizzato per scopi positivi.
23 dicembre 2023
Questo articolo è stato revisionato secondo il processo editoriale e le politiche di Science X. Gli editor hanno evidenziato i seguenti attributi mentre garantivano la credibilità dei contenuti:
- verifica dei fatti
- pubblicazione sottoposta a revisione paritaria
- fonte affidabile
- corretta la bozza
di Cody Mello-Klein, Northeastern University
I ricercatori hanno creato uno strumento di intelligenza artificiale che utilizza sequenze di eventi di vita - come la storia della salute, l'istruzione, il lavoro e il reddito - per prevedere tutto, dalla personalità di una persona alla sua mortalità.
Sviluppato utilizzando modelli di trasformatori, che alimentano modelli di linguaggio estesi (LLM) come ChatGPT, il nuovo strumento, life2vec, è stato addestrato su un set di dati estratto dall'intera popolazione della Danimarca, ovvero 6 milioni di persone. Il set di dati è stato reso disponibile esclusivamente ai ricercatori dal governo danese.
Lo strumento che i ricercatori hanno sviluppato sulla base di questo complesso set di dati è in grado di prevedere il futuro, compresa la durata della vita degli individui, con un'accuratezza che supera i modelli all'avanguardia. Ma nonostante il suo potere predittivo, il team dietro la ricerca sostiene che esso sia meglio utilizzato come base per lavori futuri, non come un fine a se stesso.
"Anche se stiamo usando la previsione per valutare quanto sono buoni questi modelli, lo strumento non dovrebbe essere usato per prevedere persone reali", afferma Tina Eliassi-Rad, professore di informatica e il Professor Joseph E. Aoun di recente nominato Presidente presso la Northeastern University. "Si tratta di un modello di previsione basato su un determinato set di dati di una specifica popolazione".
Eliassi-Rad ha portato la sua competenza in etica dell'IA al progetto. "Questi strumenti ti consentono di vedere la società da un punto di vista diverso: le politiche che hai, le regole e i regolamenti che hai", dice. "Puoi pensare ad esso come a una scansione di ciò che sta accadendo sul terreno".
Coinvolgendo scienziati sociali nel processo di costruzione di questo strumento, il team spera di apportare un approccio centrato sull'essere umano allo sviluppo dell'IA che non perda di vista gli esseri umani nel vasto set di dati su cui il loro strumento è stato addestrato.
"Questo modello offre una riflessione molto più ampia del mondo come viene vissuto dagli esseri umani rispetto a molti altri modelli", afferma Sune Lehmann, autore dell'articolo, recentemente pubblicato su Nature Computational Science. Un briefing di ricerca sull'argomento viene presentato nello stesso numero della rivista.
Al centro di life2vec si trova l'ampio set di dati che i ricercatori hanno utilizzato per addestrare il loro modello. I dati sono conservati da Statistics Denmark, l'autorità centrale sulle statistiche danesi e, sebbene strettamente regolamentati, possono essere accessibili a determinati membri del pubblico, tra cui i ricercatori. La ragione per cui sono così strettamente controllati è perché includono un registro dettagliato di ogni cittadino danese.
Gli eventi e gli elementi che compongono una vita e che sono descritti nei dati, dai fattori di salute all'istruzione al reddito. I ricercatori hanno utilizzato tali dati per creare lunghe sequenze di eventi di vita ricorrenti da alimentare nel loro modello, adottando l'approccio del modello di trasformatori utilizzato per addestrare LLM sul linguaggio e adattandolo per una vita umana rappresentata come una sequenza di eventi.
"Tutta la storia della vita di un essere umano, in un certo senso, può essere considerata come una lunga frase gigante delle molte cose che possono accadere a una persona", afferma Lehmann, professore di reti e scienze della complessità presso DTU Compute, Technical University of Denmark e in precedenza assegnista di ricerca presso la Northeastern.
Il modello utilizza le informazioni apprese osservando milioni di sequenze di eventi di vita per costruire ciò che viene chiamato rappresentazioni vettoriali in spazi di inserimento, dove inizia a categorizzare e stabilire connessioni tra eventi di vita come reddito, istruzione o fattori di salute. Questi spazi di inserimento fungono da base per le previsioni che il modello finisce per fare.
Uno degli eventi di vita che i ricercatori hanno previsto è la probabilità di mortalità di una persona.
"Quando visualizziamo lo spazio che il modello utilizza per fare previsioni, sembra un lungo cilindro che ti porta da una bassa probabilità di morte a una alta probabilità di morte", dice Lehmann. "Poi possiamo mostrare che alla fine dove c'è un'alta probabilità di morte, molte di queste persone sono effettivamente morte, e alla fine dove c'è una bassa probabilità di morire, le cause della morte sono qualcosa che non potevamo prevedere, come gli incidenti stradali".
L'articolo illustra anche come il modello sia in grado di prevedere le risposte individuali a un questionario standard sulla personalità, in particolare per quanto riguarda l'estroversione.
Eliassi-Rad e Lehmann notano che, sebbene il modello faccia previsioni molto accurate, queste sono basate su correlazioni, contesti culturali e sociali altamente specifici e il tipo di pregiudizi che esistono in ogni set di dati.
'This kind of tool is like an observatory of society—and not all societies,' Eliassi-Rad says. 'This study was done in Denmark, and Denmark has its own culture, its own laws and its own societal rules. Whether this can be done in America is a different story.'
Given all those caveats, Eliassi-Rad and Lehmann view their predictive model less like an end product and more like the beginning of a conversation. Lehmann says major tech companies have likely been creating these kinds of predictive algorithms for years in locked rooms. He hopes this work can start to create a more open, public understanding of how these tools work, what they are capable of, and how they should and shouldn't be used.
Journal information: Nature Computational Science
Provided by Northeastern University
This story is republished courtesy of Northeastern Global News news.northeastern.edu.