Nouveau modèle d'IA peut prédire la durée de vie humaine, affirment les chercheurs. Ils veulent s'assurer qu'il est utilisé à des fins bénéfiques.

25 Décembre 2023 2114

23 décembre 2023

Cet article a été examiné selon le processus éditorial et les politiques de Science X. Les éditeurs ont souligné les attributs suivants tout en garantissant la crédibilité du contenu :

vérification des faits
publication évaluée par des pairs
source fiable
relecture

par Cody Mello-Klein, Northeastern University

Des chercheurs ont créé un outil d'intelligence artificielle qui utilise des séquences d'événements de la vie - tels que l'historique de santé, l'éducation, l'emploi et le revenu - pour prédire tout, de la personnalité à la mortalité d'une personne.

Construit à partir de modèles de transformateurs, qui alimentent de grands modèles de langage (LLM) comme ChatGPT, le nouvel outil, life2vec, est entraîné sur un ensemble de données tiré de toute la population du Danemark - 6 millions de personnes. L'ensemble de données a été mis à disposition uniquement aux chercheurs par le gouvernement danois.

L'outil que les chercheurs ont construit sur la base de cet ensemble de données complexe est capable de prédire l'avenir, y compris la durée de vie des individus, avec une précision supérieure à celle des modèles de pointe. Mais malgré sa puissance prédictive, l'équipe derrière la recherche affirme qu'il est préférable de l'utiliser comme base pour des travaux futurs, plutôt que comme une fin en soi.

"Même si nous utilisons la prédiction pour évaluer la qualité de ces modèles, l'outil ne devrait pas être utilisé pour prédire des personnes réelles", déclare Tina Eliassi-Rad, professeure d'informatique et professeure inaugurale Joseph E. Aoun à l'Université Northeastern. "C'est un modèle de prédiction basé sur un ensemble de données spécifique d'une population spécifique."

Eliassi-Rad a apporté son expertise en éthique de l'IA au projet. "Ces outils vous permettent de voir votre société d'une manière différente : les politiques que vous avez, les règles et réglementations que vous avez", dit-elle. "Vous pouvez le voir comme une analyse de ce qui se passe sur le terrain."

En impliquant des scientifiques sociaux dans le processus de construction de cet outil, l'équipe espère apporter une approche axée sur l'humain au développement de l'IA qui ne perd pas de vue les humains parmi l'énorme ensemble de données sur lequel leur outil a été formé.

"Ce modèle offre une réflexion beaucoup plus complète du monde tel que vécu par les êtres humains que de nombreux autres modèles", déclare Sune Lehmann, auteur de l'article, qui a récemment été publié dans Nature Computational Science. Une présentation d'informations sur le sujet est présentée dans le même numéro de la revue.

Life2vec repose sur l'énorme ensemble de données que les chercheurs ont utilisé pour former leur modèle. Les données sont détenues par Statistics Denmark, l'autorité centrale des statistiques danoises, et bien qu'elles soient étroitement réglementées, elles sont accessibles à certains membres du public, notamment les chercheurs. La raison pour laquelle elles sont si étroitement contrôlées est qu'elles incluent un registre détaillé de chaque citoyen danois.

Les nombreux événements et éléments qui composent une vie et qui sont détaillés dans les données, des facteurs de santé à l'éducation en passant par les revenus. Les chercheurs ont utilisé ces données pour créer de longs motifs d'événements de vie récurrents à intégrer dans leur modèle, adoptant ainsi l'approche du modèle de transformateur utilisée pour former les LLM sur le langage et l'adaptant à une vie humaine représentée comme une séquence d'événements.

"Toute l'histoire d'une vie humaine peut aussi être considérée comme une immense phrase qui raconte les nombreuses choses qui peuvent arriver à une personne", déclare Lehmann, professeur de réseaux et de science de la complexité à DTU Compute, Université technique du Danemark, et auparavant chercheur postdoctoral à Northeastern.

Le modèle utilise les informations qu'il apprend en observant des millions de séquences d'événements de la vie pour construire ce qu'on appelle des représentations vectorielles dans des espaces d'incorporation, où il commence à catégoriser et à établir des liens entre des événements de la vie tels que le revenu, l'éducation ou les facteurs de santé. Ces espaces d'incorporation servent de base aux prédictions que le modèle finit par faire.

Un des événements de vie que les chercheurs ont prédit était la probabilité de mortalité d'une personne.

"Lorsque nous visualisons l'espace que le modèle utilise pour faire des prédictions, il ressemble à un long cylindre qui vous emmène d'une faible probabilité de décès à une forte probabilité de décès", explique Lehmann. "Ensuite, nous pouvons montrer qu'à la fin, où il y a une forte probabilité de décès, beaucoup de ces personnes sont réellement décédées, et à la fin, où il y a une faible probabilité de décès, les causes de décès sont quelque chose que nous ne pouvions pas prédire, comme les accidents de voiture."

L'article illustre également comment le modèle est capable de prédire les réponses individuelles à un questionnaire de personnalité standard, en particulier en ce qui concerne l'extraversion.

Eliassi-Rad et Lehmann soulignent que bien que le modèle fasse des prédictions très précises, elles sont basées sur des corrélations, des contextes culturels et sociaux très spécifiques et les types de biais présents dans chaque ensemble de données.

'This kind of tool is like an observatory of society—and not all societies,' Eliassi-Rad says. 'This study was done in Denmark, and Denmark has its own culture, its own laws and its own societal rules. Whether this can be done in America is a different story.'

Given all those caveats, Eliassi-Rad and Lehmann view their predictive model less like an end product and more like the beginning of a conversation. Lehmann says major tech companies have likely been creating these kinds of predictive algorithms for years in locked rooms. He hopes this work can start to create a more open, public understanding of how these tools work, what they are capable of, and how they should and shouldn't be used.

Journal information: Nature Computational Science

Provided by Northeastern University

This story is republished courtesy of Northeastern Global News news.northeastern.edu.

PRÉC

Le crabe robotique "Wavy Dave" révèle comment les mâles compétitionnent dans un concours de vibrations de pinces...

La fraude scientifique organisée est en augmentation alarmante, révèle une étude....