Una clave para analizar millones de células individuales

Inteligencia artificial en biomedicina

27.01.2025
Astrid Eckert / TUM

Fabian Theis ocupa la cátedra de Modelización Matemática de Sistemas Biológicos en la TUM.

Nuestro cuerpo está formado por unos 75.000 millones de células. Pero, ¿cuál es la función de cada célula y en qué se diferencian las células de una persona sana de las de una enferma? Para sacar conclusiones hay que analizar e interpretar enormes cantidades de datos. Para ello se aplican métodos de aprendizaje automático. Investigadores de la Universidad Técnica de Múnich (TUM) y del Helmholtz de Múnich han probado ahora el aprendizaje autosupervisado como método prometedor para analizar 20 millones de células o más.

En los últimos años, los investigadores han avanzado considerablemente con la tecnología unicelular. Esto permite investigar tejidos a partir de células individuales y determinar de forma sencilla las distintas funciones de cada tipo celular. El análisis puede utilizarse, por ejemplo, para realizar comparaciones con células sanas y averiguar cómo el tabaquismo, el cáncer de pulmón o una infección por COVID modifican las estructuras celulares individuales en el pulmón.

Al mismo tiempo, el análisis genera cantidades de datos cada vez mayores. Los investigadores pretenden aplicar métodos de aprendizaje automático para apoyar el proceso de reinterpretación de los conjuntos de datos existentes, derivar afirmaciones concluyentes de los patrones y aplicar los resultados a otras áreas.

Aprendizaje autosupervisado como nuevo enfoque

Fabian Theis ocupa la cátedra de Modelización Matemática de Sistemas Biológicos en la TUM. Con su equipo, ha investigado si el aprendizaje autosupervisado es más adecuado para el análisis de grandes cantidades de datos que otros métodos. El estudio se ha publicado recientemente en Nature Machine Intelligence. Esta forma de aprendizaje automático funciona con datos no etiquetados. No se necesitan datos de muestra clasificados de antemano. Eso significa que no es necesario preasignar los datos a determinados grupos de antemano. Los datos no etiquetados están disponibles en grandes cantidades y permiten la representación robusta de enormes volúmenes de datos.

El aprendizaje autosupervisado se basa en dos métodos. En el aprendizaje enmascarado -como su nombre indica- se enmascara una parte de los datos de entrada y se entrena al modelo para que sea capaz de reconstruir los elementos que faltan. Además, los investigadores aplican el aprendizaje contrastivo, en el que el modelo aprende a combinar datos similares y a separar datos disímiles.

El equipo utilizó ambos métodos de aprendizaje autosupervisado para analizar más de 20 millones de células individuales y los comparó con los resultados de los métodos de aprendizaje clásicos. En su evaluación de los distintos métodos, los investigadores se centraron en tareas como la predicción de tipos celulares y la reconstrucción de la expresión génica.

Perspectivas para el desarrollo de células virtuales

Los resultados del estudio muestran que el aprendizaje autosupervisado mejora el rendimiento especialmente en tareas de transferencia, es decir, cuando se analizan conjuntos de datos más pequeños con información procedente de un conjunto de datos auxiliar más amplio. Además, los resultados de las predicciones de células sin disparo -es decir, tareas realizadas sin preentrenamiento- también son prometedores. La comparación entre el aprendizaje enmascarado y el contrastivo muestra que el primero es más adecuado para aplicaciones con grandes conjuntos de datos unicelulares.

Los investigadores están utilizando los datos para trabajar en el desarrollo de células virtuales. Se trata de modelos informáticos completos que reflejan la diversidad de las células en distintos conjuntos de datos. Estos modelos son prometedores para el análisis de los cambios celulares que se observan, por ejemplo, en las enfermedades. Los resultados del estudio ofrecen valiosas pistas sobre cómo entrenar y optimizar estos modelos de forma más eficiente.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales

¿Está revolucionando la inteligencia artificial las ciencias de la vida?