Cómo el aprendizaje automático, la integración de datos y la IA contribuyen a mejorar las estrategias en la lucha contra los patógenos

Los investigadores desarrollan un nuevo método de aprendizaje automático

15.01.2024
© Helmholtz Institut Würzburg, Nik Schölzel

Los investigadores del HIRI que participaron en el estudio; de izquierda a derecha: Sandra Gawlitt, Lars Barquist, Chase Beisel, Yanying Yu.

Para combatir virus, bacterias y otros patógenos, la biología sintética ofrece nuevos enfoques tecnológicos cuyo rendimiento se está validando en experimentos. Investigadores del Instituto Helmholtz de Würzburg para la Investigación de Infecciones Basadas en el ARN y de la Cooperativa Helmholtz de IA aplicaron la integración de datos y la inteligencia artificial (IA) para desarrollar un enfoque de aprendizaje automático que puede predecir la eficacia de las tecnologías CRISPR con más precisión que antes. Los resultados se publican en la revista Genome Biology.

El genoma o ADN de un organismo incorpora los planos de las proteínas y orquesta la producción de nuevas células. Con el objetivo de combatir agentes patógenos, curar enfermedades genéticas o conseguir otros efectos positivos, se están utilizando tecnologías biológicas moleculares CRISPR para alterar o silenciar genes de forma específica e inhibir la producción de proteínas.

Una de estas herramientas de biología molecular es CRISPRi (de "interferencia CRISPR"). CRISPRi bloquea los genes y su expresión sin modificar la secuencia de ADN. Al igual que el sistema CRISPR-Cas, también conocido como "tijeras genéticas", esta herramienta implica un ácido ribonucleico (ARN), que sirve como ARN guía para dirigir una nucleasa (Cas). Sin embargo, a diferencia de las tijeras de genes, la nucleasa CRISPRi sólo se une al ADN sin cortarlo. Esta unión hace que el gen correspondiente no se transcriba y, por tanto, permanezca en silencio.

Hasta ahora, era difícil predecir el rendimiento de este método para un gen específico. Investigadores del Instituto Helmholtz de Würzburg para la Investigación de Infecciones Basadas en el ARN (HIRI), en colaboración con la Universidad de Würzburg y la Unidad de Cooperación Helmholtz de Inteligencia Artificial (Helmholtz AI), han desarrollado ahora un enfoque de aprendizaje automático que utiliza la integración de datos y la inteligencia artificial (IA) para mejorar dichas predicciones en el futuro.

El método

Las pantallas CRISPRi son una herramienta muy sensible que puede utilizarse para investigar los efectos de la reducción de la expresión génica. En su estudio, publicado en la revista Genome Biology, los científicos utilizaron datos de múltiples cribas de esencialidad CRISPRi de todo el genoma para entrenar un método de aprendizaje automático. Su objetivo: predecir mejor la eficacia de los ARN guía manipulados en el sistema CRISPRi.

"Desgraciadamente, los análisis de todo el genoma sólo proporcionan información indirecta sobre la eficacia de las guías. Por eso hemos aplicado un nuevo método de aprendizaje automático que desvincula la eficacia del ARN guía del impacto del gen silenciado", explica Lars Barquist. El biólogo computacional inició el estudio y dirige un grupo de investigación bioinformática en el Instituto Helmholtz de Würzburg, una sede del Centro Helmholtz de Braunschweig para la Investigación de Infecciones en cooperación con la Julius-Maximilians-Universität Würzburg.

Con el apoyo de herramientas adicionales de IA ("IA explicable"), el equipo estableció reglas de diseño comprensibles para futuros experimentos CRISPRi. Los autores del estudio validaron su enfoque realizando un cribado independiente dirigido a genes bacterianos esenciales, demostrando que sus predicciones eran más precisas que los métodos anteriores.

"Los resultados han demostrado que nuestro modelo supera a los métodos existentes y proporciona predicciones más fiables del rendimiento de CRISPRi cuando se dirige a genes específicos", afirma Yanying Yu, estudiante de doctorado del grupo de investigación de Lars Barquist y primer autor del estudio.

A los científicos les sorprendió especialmente descubrir que el ARN guía en sí no es el factor principal para determinar la depleción de CRISPRi en las cribas de esencialidad. "Ciertas características específicas de los genes relacionadas con su expresión parecen tener un mayor impacto del que se suponía anteriormente", explica Yu.

El estudio también revela que la integración de datos de múltiples conjuntos de datos mejora significativamente la precisión predictiva y permite una evaluación más fiable de la eficacia de los ARN guía. "Ampliar nuestros datos de entrenamiento reuniendo múltiples experimentos es esencial para crear mejores modelos de predicción. Antes de nuestro estudio, la falta de datos era un factor limitante importante para la precisión de la predicción", resume el profesor junior Barquist. El enfoque ahora publicado será muy útil para planificar experimentos CRISPRi más eficaces en el futuro y servirá tanto a la biotecnología como a la investigación básica. "Nuestro estudio proporciona un modelo para desarrollar herramientas más precisas para manipular la expresión génica bacteriana y, en última instancia, ayudar a comprender y combatir mejor los patógenos", afirma Barquist.

Nota: Este artículo ha sido traducido utilizando un sistema informático sin intervención humana. LUMITOS ofrece estas traducciones automáticas para presentar una gama más amplia de noticias de actualidad. Como este artículo ha sido traducido con traducción automática, es posible que contenga errores de vocabulario, sintaxis o gramática. El artículo original en Inglés se puede encontrar aquí.

Publicación original

Más noticias del departamento ciencias

Noticias más leídas

Más noticias de nuestros otros portales

Tan cerca que
incluso las moléculas
se vuelven rojas...