Una clave para analizar millones de células individuales
Inteligencia artificial en biomedicina
En los últimos años, los investigadores han avanzado considerablemente con la tecnología unicelular. Esto permite investigar tejidos a partir de células individuales y determinar de forma sencilla las distintas funciones de cada tipo celular. El análisis puede utilizarse, por ejemplo, para realizar comparaciones con células sanas y averiguar cómo el tabaquismo, el cáncer de pulmón o una infección por COVID modifican las estructuras celulares individuales en el pulmón.
Al mismo tiempo, el análisis genera cantidades de datos cada vez mayores. Los investigadores pretenden aplicar métodos de aprendizaje automático para apoyar el proceso de reinterpretación de los conjuntos de datos existentes, derivar afirmaciones concluyentes de los patrones y aplicar los resultados a otras áreas.
Aprendizaje autosupervisado como nuevo enfoque
Fabian Theis ocupa la cátedra de Modelización Matemática de Sistemas Biológicos en la TUM. Con su equipo, ha investigado si el aprendizaje autosupervisado es más adecuado para el análisis de grandes cantidades de datos que otros métodos. El estudio se ha publicado recientemente en Nature Machine Intelligence. Esta forma de aprendizaje automático funciona con datos no etiquetados. No se necesitan datos de muestra clasificados de antemano. Eso significa que no es necesario preasignar los datos a determinados grupos de antemano. Los datos no etiquetados están disponibles en grandes cantidades y permiten la representación robusta de enormes volúmenes de datos.
El aprendizaje autosupervisado se basa en dos métodos. En el aprendizaje enmascarado -como su nombre indica- se enmascara una parte de los datos de entrada y se entrena al modelo para que sea capaz de reconstruir los elementos que faltan. Además, los investigadores aplican el aprendizaje contrastivo, en el que el modelo aprende a combinar datos similares y a separar datos disímiles.
El equipo utilizó ambos métodos de aprendizaje autosupervisado para analizar más de 20 millones de células individuales y los comparó con los resultados de los métodos de aprendizaje clásicos. En su evaluación de los distintos métodos, los investigadores se centraron en tareas como la predicción de tipos celulares y la reconstrucción de la expresión génica.
Perspectivas para el desarrollo de células virtuales
Los resultados del estudio muestran que el aprendizaje autosupervisado mejora el rendimiento especialmente en tareas de transferencia, es decir, cuando se analizan conjuntos de datos más pequeños con información procedente de un conjunto de datos auxiliar más amplio. Además, los resultados de las predicciones de células sin disparo -es decir, tareas realizadas sin preentrenamiento- también son prometedores. La comparación entre el aprendizaje enmascarado y el contrastivo muestra que el primero es más adecuado para aplicaciones con grandes conjuntos de datos unicelulares.
Los investigadores están utilizando los datos para trabajar en el desarrollo de células virtuales. Se trata de modelos informáticos completos que reflejan la diversidad de las células en distintos conjuntos de datos. Estos modelos son prometedores para el análisis de los cambios celulares que se observan, por ejemplo, en las enfermedades. Los resultados del estudio ofrecen valiosas pistas sobre cómo entrenar y optimizar estos modelos de forma más eficiente.
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.