Neues KI-Modell kann menschliche Lebensdauer vorhersagen, sagen Forscher. Sie möchten sicherstellen, dass es zum Guten verwendet wird.

23. Dezember 2023
Dieser Artikel wurde gemäß dem redaktionellen Prozess und den Richtlinien von Science X überprüft. Die Herausgeber haben folgende Merkmale hervorgehoben, um die Glaubwürdigkeit des Inhalts zu gewährleisten:
- Tatsachenprüfung
- Peer-reviewed-Publikation
- Vertrauenswürdige Quelle
- Korrektur gelesen
von Cody Mello-Klein, Northeastern University
Forscher haben ein künstliche Intelligenz-Tool entwickelt, das Sequenzen von Lebensereignissen verwendet - wie Gesundheitsgeschichte, Bildung, Beruf und Einkommen - um alles von der Persönlichkeit bis zur Sterblichkeit einer Person vorherzusagen.
Mit Hilfe von Transformatormodellen, die große Sprachmodelle (LLMs) wie ChatGPT antreiben, wird das neue Tool life2vec auf einem Datensatz trainiert, der aus der gesamten Bevölkerung Dänemarks stammt - 6 Millionen Menschen. Der Datensatz wurde den Forschern nur von der dänischen Regierung zur Verfügung gestellt.
Das von den Forschern auf Grundlage dieses komplexen Datensatzes entwickelte Tool ist in der Lage, die Zukunft vorherzusagen, einschließlich der Lebensdauer von Individuen, mit einer Genauigkeit, die den modernsten Modellen überlegen ist. Trotz seiner Vorhersagekraft sagt das Forschungsteam jedoch, dass es am besten als Grundlage für zukünftige Arbeiten verwendet wird und nicht als eigenständiges System.
'Obwohl wir Vorhersagen verwenden, um die Qualität dieser Modelle zu bewerten, sollte das Tool nicht zur Vorhersage von realen Personen verwendet werden', sagt Tina Eliassi-Rad, Professorin für Informatik und erste Inhaberin des Joseph-E.-Aoun-Lehrstuhls an der Northeastern University. 'Es ist ein Vorhersagemodell, das auf einem bestimmten Datensatz einer bestimmten Population basiert.'
Eliassi-Rad brachte ihre Expertise in KI-Ethik in das Projekt ein. 'Diese Werkzeuge ermöglichen es Ihnen, Ihre Gesellschaft auf eine andere Art und Weise zu betrachten: die Politik, die Sie haben, die Regeln und Vorschriften, die Sie haben', sagt sie. 'Sie können es als eine Art Überblick darüber betrachten, was vor Ort geschieht.'
Indem sie Sozialwissenschaftler in den Prozess des Aufbaus dieses Tools einbeziehen, hofft das Team, dass es einen auf den Menschen ausgerichteten Ansatz für die Entwicklung von KI bringt, der den Menschen inmitten des massiven Datensatzes, auf dem ihr Tool trainiert wurde, nicht aus den Augen verliert.
'Dieses Modell bietet eine viel umfassendere Darstellung der Welt, wie sie von Menschen gelebt wird, als viele andere Modelle', sagt Sune Lehmann, Autor des Artikels, der kürzlich in Nature Computational Science veröffentlicht wurde. Eine Forschungszusammenfassung zum Thema wird in der gleichen Ausgabe der Zeitschrift präsentiert.
Im Zentrum von life2vec steht der massive Datensatz, den die Forscher zur Schulung ihres Modells verwendet haben. Die Daten werden von Statistics Denmark, der zentralen Behörde für dänische Statistik, verwaltet und können von einigen Mitgliedern der Öffentlichkeit, einschließlich Forschern, abgerufen werden. Der Grund für die strenge Kontrolle besteht darin, dass der Datensatz ein detailliertes Register jedes dänischen Bürgers enthält.
Die vielen Ereignisse und Elemente, die ein Leben ausmachen und in den Daten detailliert aufgeführt sind, von Gesundheitsfaktoren und Bildung bis hin zum Einkommen. Die Forscher verwendeten diese Daten, um lange Muster wiederkehrender Lebensereignisse zu schaffen, die in ihr Modell eingespeist wurden. Dabei wurde der Ansatz des Transformator-Modells verwendet, mit dem LLMs auf Sprache trainiert werden, und für ein menschliches Leben, das als Sequenz von Ereignissen dargestellt wird, angepasst.
'Die ganze Geschichte eines menschlichen Lebens kann man sich irgendwie als einen riesigen langen Satz vorstellen, der aus den vielen Dingen besteht, die einer Person passieren können', sagt Lehmann, Professor für Netzwerke und Komplexitätswissenschaft an der DTU Compute, Technische Universität Dänemark und ehemaliger Postdoktorand an der Northeastern University.
Das Modell nutzt die Informationen, die es aus der Beobachtung von Millionen von Sequenzen von Lebensereignissen lernt, um sogenannte Vektorrepräsentationen in Einbettungsräumen zu erstellen, in denen es anfängt, Lebensereignisse wie Einkommen, Bildung oder Gesundheitsfaktoren zu kategorisieren und Verbindungen herzustellen. Diese Einbettungsräume bilden die Grundlage für die Vorhersagen, die das Modell letztendlich macht.
Eines der Ereignisse, das die Forscher vorhergesagt haben, war die Wahrscheinlichkeit des Todes einer Person.
'Wenn wir den Raum visualisieren, den das Modell zur Vorhersage verwendet, sieht er aus wie eine lange Zylinder, der von einer geringen Wahrscheinlichkeit des Todes zu einer hohen Wahrscheinlichkeit des Todes führt', sagt Lehmann. 'Dann können wir zeigen, dass dort, wo es eine hohe Wahrscheinlichkeit des Todes gibt, viele dieser Menschen tatsächlich gestorben sind, und dass die Todesursachen in Bereichen mit einer geringen Wahrscheinlichkeit des Todes etwas sind, das wir nicht vorhersagen konnten, wie Autounfälle.'
Der Artikel veranschaulicht auch, wie das Modell in der Lage ist, individuelle Antworten auf einen standardisierten Persönlichkeitsfragebogen vorherzusagen, insbesondere im Hinblick auf die Extraversion.
Eliassi-Rad und Lehmann betonen jedoch, dass die hochpräzisen Vorhersagen des Modells auf Korrelationen, hochspezifischen kulturellen und gesellschaftlichen Kontexten sowie den Arten von Voreingenommenheiten beruhen, die in jedem Datensatz vorhanden sind.
'This kind of tool is like an observatory of society—and not all societies,' Eliassi-Rad says. 'This study was done in Denmark, and Denmark has its own culture, its own laws and its own societal rules. Whether this can be done in America is a different story.'
Given all those caveats, Eliassi-Rad and Lehmann view their predictive model less like an end product and more like the beginning of a conversation. Lehmann says major tech companies have likely been creating these kinds of predictive algorithms for years in locked rooms. He hopes this work can start to create a more open, public understanding of how these tools work, what they are capable of, and how they should and shouldn't be used.
Journal information: Nature Computational Science
Provided by Northeastern University
This story is republished courtesy of Northeastern Global News news.northeastern.edu.