El pasado 18 de diciembre se publicó en la revista Nature Computational Science un estudio realmente interesante. En concreto, se centra en el desarrollo de un sistema de inteligencia artificial (IA) capaz de analizar los datos vitales de millones de personas y, con ellos, predecir diversos aspectos de su futuro. Entre ellos, su nivel de ingresos, su probabilidad de éxito profesional o, incluso, el momento de su muerte.
No es la primera vez que se intenta algo parecido. Por ejemplo, Matthew Salganik, sociólogo de la Universidad de Princeton que no participó en este trabajo, trató de desarrollar junto a un amplio equipo de investigadores un modelo de aprendizaje automático con base en el análisis de 5.000 niños a lo largo de 15 años. Sin embargo, no consiguió crear un algoritmo capaz de arrojar predicciones tan precisas como este.
Out now! @suneman, @germansave, and colleagues introduce an approach that creates embeddings of life-events in a single vector space, allowing them to predict different life-event outcomes. https://t.co/rWefgj6D4M
— Nature Computational Science (@NatComputSci) December 18, 2023
Según Sune Lehmann, que trabaja en la Universidad Técnica de Dinamarca y es la autora principal del estudio, la clave ha estado en utilizar modelos de lenguaje grandes, que son los mismos que impulsan ChatGPT, Bard o Grok, por ejemplo. Su funcionamiento se basa en el análisis de grandes cantidades de texto para, después, buscar patrones en cadenas de palabras y frases. De este modo, pueden predecir qué términos deberían aparecer a continuación dentro de una oración.
Una tasa de error muy pequeña
“Al igual que sucede en el lenguaje, el orden en el que suceden los acontecimientos de la vida es muy importante”, indica Lehmann al respecto. Los investigadores pudieron utilizar diversos registros sanitarios y laborales de los seis millones de ciudadanos daneses que existen en la actualidad y, de esta forma, conseguir datos muy valiosos sobre su salario y poder adquisitivo, sus beneficios sociales, sus visitas al hospital y diagnósticos de enfermedades, etc.
A continuación, sintetizaron esa información creando prompts del tipo: “en agosto de 2010, Agnes ganaba 30.000 coronas danesas como matrona en un hospital de Copenhague”. A partir de ellos, los científicos crearon historias de vida de cada individuo en un período comprendido entre 2008 y 2016. Después, solicitaron al sistema de inteligencia artificial, que ha recibido el nombre de life2vec, que generara una historia de vida futura.
Una de las preguntas que formularon a life2vec fue quiénes morirían antes del año 2020. Sin tener los datos comprendidos al período 2016-2020, el modelo fue capaz de acertar el 78 % de los casos. Por si fuese poco, la mayoría de los errores se debieron a ataques cardíacos y, sobre todo, accidentes, los cuales son prácticamente imposibles de predecir. Para obtener esos resultados, estableció que los bajos niveles de ingresos, haber recibido el diagnóstico de una enfermedad mental y ser hombre incrementaban el riesgo de sufrir una muerte prematura.
| Casi todos los errores de la IA se debieron a accidentes o ataques cardíacos
Sin embargo, el modelo podría no ser válido para otras poblaciones fuera de Dinamarca. Como afirma el psicólogo del University College de Londres, Youyou Wu, “habría que adaptarlo usando datos de la población de otros países. Solo así sería posible averiguar si tiene potencial para revelar patrones universales o para resaltar matices culturales únicos”. También añade que “los sesgos en los datos podrían confundir sus predicciones”.
Usos potenciales
Según Wu, esta IA podría tener un potencial negativo si termina utilizándose para tomar decisiones de contratación de pólizas de salud y otras primas de seguros, por ejemplo. Sin embargo, Lehmann prefiere explorar su lado más positivo. Por ejemplo, asegura que life2vec podría emplearse para detectar riesgos de sufrir enfermedades y, con ello, ayudar a las personas a tomar las medidas adecuadas para mantenerse saludables.
Además, los investigadores se dieron cuenta de que el algoritmo era capaz de predecir con mucha exactitud otros aspectos, como la propensión a ser introvertido o extrovertido. Sin embargo, según la científica social computacional de la Escuela de Negocios de Columbia, Sandra Matz, esto no es tan sorprendente. En este sentido, afirma que modelos más simples han conseguido relacionar ciertas profesiones, como es el caso de la de peluquero o estilista, con una mayor extraversión.
/psg