Cómo la inteligencia artificial puede mejorar la detección de proteínas
Utilizar la IA para ampliar los límites de la microscopía
Mahyar Dahmardeh
Las moléculas biológicas, como las proteínas, son componentes centrales de todos los sistemas vivos y dictan todas las reacciones fisiológicas en condiciones de salud y enfermedad. En particular, muchas proteínas pequeñas desempeñan funciones críticas en la regulación de la respuesta inmunitaria, la inflamación y las enfermedades neurodegenerativas. Por ello, los métodos rápidos y no invasivos de detección de proteínas pueden ayudarnos a mejorar el diagnóstico de enfermedades y el desarrollo de fármacos.
Los métodos tradicionales de detección de proteínas consisten en marcarlas con una etiqueta fluorescente o radiactiva para poder rastrearlas y detectarlas. Sin embargo, se ha demostrado que estos métodos son bastante costosos y requieren mucho tiempo. Aún más problemático es el hecho de que estas etiquetas pueden alterar la función de la proteína estudiada, restando fiabilidad a los datos obtenidos. A medida que en los últimos años ha aumentado el interés científico por las funciones de las proteínas, también lo ha hecho el interés por los métodos de detección sin etiquetas. Uno de estos métodos, considerado actualmente como una de las técnicas más eficaces y sensibles de detección de proteínas sin etiquetas y en tiempo real, es la microscopía de dispersión interferométrica (iSCAT).
La iSCAT se basa en la detección sensible de la luz dispersada por proteínas individuales mediante interferometría. A medida que las proteínas individuales se sedimentan de un tampón a un cubreobjetos, la diminuta sombra de la proteína proyectada en una cámara proporciona información sobre su tamaño y masa. De ahí que el método también se conozca como fotometría de masas. Sin embargo, una combinación de fuentes de ruido técnico y fluctuaciones de fondo similares al moteado ha limitado hasta ahora la sensibilidad de la detección iSCAT a proteínas mayores de unos 40 KDa.
Utilización de la IA para ampliar los límites de la microscopía
Con el fin de aumentar aún más la sensibilidad del iSCAT, un equipo del MPL formado por el ingeniero eléctrico Mahyar Dahmardeh, el informático Houman Mirzaalian y el físico-químico Hisham Mazal, en torno al director general Vahid Sandoghdar, ha colaborado con Harald Köstler, de la FAU, para emplear dos técnicas de aprendizaje automático en la detección de proteínas de sólo 10 kDa o menos.
En un artículo publicado en Nature Methods, muestran cómo pueden utilizar el algoritmo iForest en combinación con la técnica FastDVDnet para lograr este resultado. Ambas son técnicas de aprendizaje automático no supervisado, lo que significa que no es necesario entrenarlas primero con un conjunto de datos etiquetados. El aprendizaje automático no supervisado es muy deseable en microscopía porque permite identificar patrones y relaciones en grandes conjuntos de datos sin conocer el modelo de imagen subyacente. Esto es especialmente importante cuando el límite de detección está en el límite del nivel de ruido y se carece de datos etiquetados para entrenar la red.
FastDVDnet es una técnica avanzada de eliminación del ruido de las imágenes de microscopía mediante redes neuronales profundas. Está optimizada para el procesamiento en paralelo, lo que le permite procesar conjuntos de datos muy grandes en un tiempo relativamente corto. En este caso, los investigadores utilizaron FastDVDnet para identificar imágenes iSCAT de proteínas a partir de las secuencias de vídeo grabadas. A continuación, iForest utilizó las características espaciotemporales extraídas por FastDVDnet para agrupar los datos iSCAT.
El algoritmo de aprendizaje automático no supervisado isolation Forest (iForest) se utiliza habitualmente para tareas de detección de anomalías. Es especialmente adecuado para la microscopía porque puede manejar datos de alta dimensión con un gran número de características, lo que da lugar a resultados más precisos y completos. Esto es especialmente útil cuando se analizan datos de microscopía, donde la identificación de características raras o anómalas adquiere importancia. Por ejemplo, la detección de anomalías de iForest puede utilizarse para detectar la presencia de estructuras raras dentro de un tejido biológico o para identificar células con morfologías inusuales. Este algoritmo puede ayudar a identificar características raras o inusuales que los métodos de análisis tradicionales podrían muy bien pasar por alto.
El profesor Vahid Sandoghdar recuerda el duro trabajo de su equipo, pero también espera ya con impaciencia el próximo reto: "Hemos recorrido un largo camino desde nuestro primer informe sobre la detección de proteínas pequeñas sin etiquetas en Nature Communications en 2014. Estamos decididos a superar el límite de detección mejorando los métodos físicos de medición y desarrollando algoritmos de aprendizaje automático más sofisticados. Realmente no hay ninguna razón fundamental por la que no debamos ser capaces de detectar moléculas por debajo de 1kDa, acercándonos al peso de incluso una sola molécula lipídica."
Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.