Nuevo modelo de IA puede predecir la esperanza de vida humana, afirman los investigadores. Quieren asegurarse de que se utilice para fines benéficos.
23 de diciembre de 2023
Este artículo ha sido revisado de acuerdo con el proceso editorial y las políticas de Science X. Los editores han destacado los siguientes atributos al tiempo que aseguran la credibilidad del contenido:
- verificación de datos
- publicación evaluada por expertos
- fuentes confiables
- corrección de pruebas
por Cody Mello-Klein, Universidad Northeastern
Los investigadores han creado una herramienta de inteligencia artificial que utiliza secuencias de eventos de la vida, como historial de salud, educación, empleo e ingresos, para predecir desde la personalidad de una persona hasta su mortalidad.
Construido utilizando modelos transformadores, que alimentan a los modelos de lenguaje grandes (LLM) como ChatGPT, la nueva herramienta, life2vec, se entrena con un conjunto de datos extraídos de toda la población de Dinamarca, que consta de 6 millones de personas. El conjunto de datos fue proporcionado únicamente a los investigadores por el gobierno danés.
La herramienta que los investigadores construyeron basada en este conjunto complejo de datos es capaz de predecir el futuro, incluida la esperanza de vida de las personas, con una precisión que supera a los modelos de última generación. Sin embargo, a pesar de su poder predictivo, el equipo detrás de la investigación afirma que es mejor utilizarla como base para trabajos futuros, no como un fin en sí mismo.
"A pesar de que estamos utilizando la predicción para evaluar qué tan buenos son estos modelos, la herramienta no debe ser utilizada para predecir a personas reales", dice Tina Eliassi-Rad, profesora de ciencias de la computación y profesora inaugural President Joseph E. Aoun en la Universidad Northeastern. "Es un modelo de predicción basado en un conjunto de datos específico de una población específica".
Eliassi-Rad aportó su experiencia en ética en inteligencia artificial al proyecto. "Estas herramientas te permiten ver tu sociedad de una manera diferente: las políticas que tienes, las reglas y regulaciones que tienes", dice. "Puedes pensar en ello como un escaneo de lo que está sucediendo en el terreno".
Al involucrar a científicos sociales en el proceso de construcción de esta herramienta, el equipo espera que esta enfoque centrado en el ser humano al desarrollo de IA no pierda de vista a los seres humanos en medio del enorme conjunto de datos en los que se ha entrenado su herramienta.
"Este modelo ofrece una reflexión mucho más completa del mundo tal como es vivido por los seres humanos que muchos otros modelos", dice Sune Lehmann, autor del artículo, que fue publicado recientemente en Nature Computational Science. Un resumen de investigación sobre el tema se presenta en el mismo número de la revista.
En el corazón de life2vec se encuentra el conjunto masivo de datos que los investigadores utilizaron para entrenar su modelo. Los datos son propiedad de Statistics Denmark, la autoridad central en estadísticas danesas, y aunque están regulados de cerca, pueden ser accesibles para algunos miembros del público, incluidos los investigadores. La razón por la que están tan controlados es porque incluyen un registro detallado de cada ciudadano danés.
Los muchos eventos y elementos que conforman una vida y se describen en los datos incluyen factores de salud, educación e ingresos. Los investigadores utilizaron esos datos para crear patrones largos de eventos recurrentes de la vida para alimentar su modelo, adoptando el enfoque del modelo transformador utilizado para entrenar LLM en lenguaje y adaptándolo a una vida humana representada como una secuencia de eventos.
"Toda la historia de la vida humana, de alguna manera, también se puede pensar como una oración larga gigante de las muchas cosas que le pueden suceder a una persona", dice Lehmann, profesor de redes y ciencia de la complejidad en DTU Compute, Universidad Técnica de Dinamarca, y anteriormente becario postdoctoral en Northeastern.
El modelo utiliza la información que aprende al observar millones de secuencias de eventos de la vida para construir lo que se llaman representaciones vectoriales en espacios de incrustación, donde comienza a categorizar y establecer conexiones entre eventos de la vida como ingresos, educación o factores de salud. Estos espacios de incrustación sirven como base para las predicciones que el modelo realiza en última instancia.
Uno de los eventos de la vida que los investigadores predijeron fue la probabilidad de mortalidad de una persona.
"Cuando visualizamos el espacio que el modelo utiliza para hacer predicciones, se parece a un cilindro largo que te lleva desde una baja probabilidad de muerte hasta una alta probabilidad de muerte", dice Lehmann. "Luego podemos mostrar que al final donde hay una alta probabilidad de muerte, muchas de esas personas realmente murieron, y al final donde hay una baja probabilidad de morir, las causas de la muerte son algo que no pudimos predecir, como accidentes automovilísticos".
El artículo también ilustra cómo el modelo es capaz de predecir respuestas individuales a un cuestionario de personalidad estándar, especialmente en lo que respecta a la extraversión.
Eliassi-Rad y Lehmann señalan que aunque el modelo realiza predicciones altamente precisas, estas se basan en correlaciones, contextos culturales y sociales altamente específicos y los tipos de sesgos que existen en cada conjunto de datos.
'This kind of tool is like an observatory of society—and not all societies,' Eliassi-Rad says. 'This study was done in Denmark, and Denmark has its own culture, its own laws and its own societal rules. Whether this can be done in America is a different story.'
Given all those caveats, Eliassi-Rad and Lehmann view their predictive model less like an end product and more like the beginning of a conversation. Lehmann says major tech companies have likely been creating these kinds of predictive algorithms for years in locked rooms. He hopes this work can start to create a more open, public understanding of how these tools work, what they are capable of, and how they should and shouldn't be used.
Journal information: Nature Computational Science
Provided by Northeastern University
This story is republished courtesy of Northeastern Global News news.northeastern.edu.