¿Puede la IA que conduce ChatGPT ayudar a detectar los primeros signos de la enfermedad de Alzheimer?
Investigadores de Drexel utilizan el chatbot para detectar indicadores de Alzheimer en el habla espontánea
Computer-generated image
Publicado en la revista PLOS Digital Health, el estudio de Drexel es el último de una serie de esfuerzos por demostrar la eficacia de los programas de procesamiento del lenguaje natural en la predicción precoz del Alzheimer, aprovechando las investigaciones actuales que sugieren que el deterioro del lenguaje puede ser un indicador precoz de trastornos neurodegenerativos.
Encontrar una señal temprana
La práctica actual para diagnosticar la enfermedad de Alzheimer suele implicar una revisión de la historia clínica y una larga serie de evaluaciones y pruebas físicas y neurológicas. Aunque la enfermedad aún no tiene cura, detectarla a tiempo puede dar a los pacientes más opciones terapéuticas y de apoyo. Dado que el deterioro del lenguaje es un síntoma en el 60-80% de los pacientes con demencia, los investigadores se han centrado en programas capaces de detectar indicios sutiles -como vacilaciones, errores gramaticales y de pronunciación y olvido del significado de las palabras- como prueba rápida que podría indicar si un paciente debe someterse o no a un examen completo.
"Sabemos por investigaciones en curso que los efectos cognitivos de la enfermedad de Alzheimer pueden manifestarse en la producción del lenguaje", afirma el doctor Hualou Liang, profesor de la Facultad de Ingeniería Biomédica, Ciencias y Sistemas de Salud de Drexel y coautor de la investigación. "Las pruebas más utilizadas para la detección precoz del Alzheimer se fijan en características acústicas, como las pausas, la articulación y la calidad vocal, además de en pruebas de cognición. Pero creemos que la mejora de los programas de procesamiento del lenguaje natural ofrece otra vía para apoyar la identificación precoz del Alzheimer".
Un programa que escucha y aprende
GPT-3, oficialmente la tercera generación del General Pretrained Transformer (GPT) de OpenAI, utiliza un algoritmo de aprendizaje profundo, entrenado mediante el procesamiento de grandes cantidades de información de Internet, con especial atención a cómo se utilizan las palabras y cómo se construye el lenguaje. Este entrenamiento le permite producir una respuesta similar a la humana en cualquier tarea que implique lenguaje, desde respuestas a preguntas sencillas hasta escribir poemas o ensayos.
GPT-3 es especialmente bueno en el "aprendizaje sin datos", es decir, puede responder a preguntas que normalmente requerirían un conocimiento externo que no se le ha proporcionado. Por ejemplo, pedirle al programa que escriba "Cliff's Notes" de un texto, normalmente requeriría una explicación de que se trata de un resumen. Pero GPT-3 ha recibido suficiente formación como para entender la referencia y adaptarse para producir la respuesta esperada.
"El enfoque sistémico de GPT-3 en el análisis y la producción del lenguaje lo convierte en un candidato prometedor para identificar las sutiles características del habla que pueden predecir la aparición de la demencia", afirma Felix Agbavor, investigador doctoral de la Facultad y autor principal del trabajo. "Entrenar GPT-3 con un conjunto masivo de datos de entrevistas -algunas de ellas con enfermos de Alzheimer- le proporcionaría la información que necesita para extraer patrones del habla que luego podrían aplicarse para identificar marcadores en futuros pacientes".
En busca de señales del habla
Los investigadores probaron su teoría entrenando el programa con un conjunto de transcripciones de una parte de un conjunto de datos de grabaciones del habla recopiladas con el apoyo de los Institutos Nacionales de Salud específicamente con el fin de probar la capacidad de los programas de procesamiento del lenguaje natural para predecir la demencia. El programa captó características significativas del uso de las palabras, la estructura de las frases y el significado del texto para producir lo que los investigadores denominan una "incrustación", un perfil característico del habla del Alzheimer.
A continuación, utilizaron la incrustación para reentrenar el programa y convertirlo en una máquina de detección del Alzheimer. Para probarlo, pidieron al programa que revisara docenas de transcripciones del conjunto de datos y decidiera si cada una de ellas había sido producida por alguien que estaba desarrollando Alzheimer.
Tras someter a dos de los mejores programas de procesamiento del lenguaje natural a la misma prueba, el grupo descubrió que GPT-3 funcionaba mejor que ambos en cuanto a la identificación precisa de ejemplos de Alzheimer, la identificación de ejemplos de no Alzheimer y el menor número de casos perdidos que ambos programas.
En una segunda prueba se utilizó el análisis textual de GPT-3 para predecir la puntuación de varios pacientes del conjunto de datos en una prueba común para predecir la gravedad de la demencia, denominada Mini-Mental State Exam (MMSE).
A continuación, el equipo comparó la precisión de predicción de GPT-3 con la de un análisis que utilizaba únicamente las características acústicas de las grabaciones, como las pausas, la fuerza de la voz y la mala pronunciación, para predecir la puntuación del MMSE. GPT-3 demostró ser casi un 20% más preciso a la hora de predecir la puntuación MMSE de los pacientes.
"Nuestros resultados demuestran que la incrustación de texto, generada por GPT-3, puede utilizarse de forma fiable no sólo para detectar individuos con enfermedad de Alzheimer a partir de controles sanos, sino también para inferir la puntuación de la prueba cognitiva del sujeto, ambos basados únicamente en datos del habla", escribieron. "Demostramos además que la incrustación de texto supera al enfoque convencional basado en características acústicas e incluso compite con modelos ajustados. Estos resultados, en conjunto, sugieren que la incrustación de texto basada en GPT-3 es un enfoque prometedor para la evaluación de la EA y tiene el potencial de mejorar el diagnóstico precoz de la demencia."
Continuar la búsqueda
Para aprovechar estos prometedores resultados, los investigadores tienen previsto desarrollar una aplicación web que podría utilizarse en casa o en la consulta de un médico como herramienta de preselección.
"Nuestra prueba de concepto demuestra que podría ser una herramienta sencilla, accesible y con la sensibilidad adecuada para realizar pruebas en la comunidad", afirma Liang. "Podría ser muy útil para el cribado precoz y la evaluación de riesgos antes de un diagnóstico clínico".
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.