Interpretación de grandes conjuntos de datos médicos

ScPoli permite representaciones multiescala de células y muestras

10.10.2023
Computer-generated image

Imagen simbólica

La creciente cantidad de datos registrados en la investigación médica sólo puede conducir a avances científicos y terapias esenciales para los pacientes si se interpretan y analizan correctamente. Los informáticos del Helmholtz de Múnich han desarrollado un modelo generativo denominado scPoli (single-cell population level integration), que realiza la integración de datos de conjuntos de datos a gran escala de alta calidad de células individuales para crear valiosos mapas de referencia unicelulares del cuerpo humano, los llamados atlas unicelulares, para la investigación médica.

Los atlas ofrecen un enfoque rápido y detallado para la interpretación de los datos, que puede ser aplicado por la comunidad de investigadores médicos y, en última instancia, conducir a nuevos conocimientos biológicos y a la comprensión de las enfermedades. El modelo se ha presentado ahora en Nature Methods.

En los últimos años hemos asistido a un aumento astronómico tanto de la cantidad como de la complejidad de los datos, especialmente en el campo de la investigación médica. Los científicos son ahora capaces de captar tejidos y órganos con un nivel de detalle fascinante, hasta el nivel de las células individuales. La combinación de los conjuntos de datos resultantes ha llevado a la creación de los llamados atlas unicelulares, que son mapas de referencia de cada célula presente en un órgano concreto con el objetivo de crear un mapa de todo el cuerpo humano. Estos conjuntos de datos a gran escala y de alta calidad permiten no sólo obtener nuevos conocimientos biológicos sobre la heterogeneidad celular de determinados tejidos, sino también acelerar varios pasos de los flujos de trabajo de análisis que suelen llevar mucho tiempo. Gracias a estos atlas, los investigadores pueden, por ejemplo, comparar órganos de personas sanas con los de pacientes enfermos, lo que permite obtener valiosos datos sobre el desarrollo y la progresión de las enfermedades.

A medida que aumenta la escala de estos atlas, surge la necesidad de modelos de aprendizaje automático y algoritmos computacionales para analizar e integrar los datos. Con un enfoque de representación multiescala tanto de células como de muestras, que a menudo representan a pacientes en estudios a gran escala, el Prof. Fabian Theis, de Helmholtz Múnich y profesor de la Universidad Técnica de Múnich, así como el Dr. Mohammad Lotfollahi y Carlo De Donno, del Centro de Salud Computacional de Helmholtz Múnich, han desarrollado un nuevo modelo generativo denominado scPoli (abreviatura de integración a nivel de población unicelular). Se trata del primer modelo de integración de datos que puede producir representaciones tanto para células como para muestras. Con este nuevo modelo generativo, los conjuntos de datos médicos pueden analizarse fácilmente para identificar las principales fuentes de variabilidad, al tiempo que se tiene en cuenta la heterogeneidad natural que se produce entre los datos de diferentes individuos y células.

El equipo ha desarrollado scPoli con la intención de mejorar la interpretabilidad de los estudios unicelulares. A diferencia de otros modelos, que sólo producen representaciones celulares, scPoli ofrece un novedoso punto de vista a los investigadores para investigar y relacionar patrones a nivel de muestra, lo que tiene el potencial de mejorar los flujos de trabajo de integración y la interpretación.

Funcionalidad probada: Creación más rápida de atlas interpretables

Los investigadores del Helmholtz de Múnich ya han demostrado la funcionalidad de su modelo integrando datos de dos importantes atlas unicelulares. La integración del Human Lung Cell Atlas, un mapa de referencia del pulmón publicado recientemente por el equipo del Prof. Fabian Theis, mostró una mejora en el rendimiento y ofreció una nueva visión a nivel de muestra. Además, scPoli se utilizó para integrar un atlas a gran escala de PBMC (un atlas unicelular de células mononucleares de sangre periférica), compuesto por 7,8 millones de células, lo que pone de relieve las posibles propiedades de escalado, fundamentales para los estudios de integración a gran escala.

Una característica única: El modelo muestra variaciones entre muestras y células

ScPoli es único en comparación con los esfuerzos anteriores de integración de datos. Propone varios casos de uso para el análisis multiescala porque, por primera vez, los científicos pueden explorar simultáneamente representaciones de células y muestras o pacientes, capturando las características y rasgos de las células individuales con mucho más detalle que nunca. Se demuestra que scPoli puede permitir la clasificación multiescala de células y muestras, así como flujos de trabajo guiados de integración de datos. El modelo tiene el potencial de acelerar la creación y el uso de atlas, lo que a su vez acelera la comprensión de las enfermedades y el desarrollo de nuevas terapias.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales

Tan cerca que
incluso las moléculas
se vuelven rojas...