Comment l'apprentissage automatique, l'intégration des données et l'IA contribuent à de meilleures stratégies dans la lutte contre les agents pathogènes
Des chercheurs développent une nouvelle approche de l'apprentissage automatique
Le génome ou l'ADN d'un organisme incorpore le schéma directeur des protéines et orchestre la production de nouvelles cellules. Dans le but de combattre les agents pathogènes, de guérir les maladies génétiques ou d'obtenir d'autres effets positifs, les technologies de biologie moléculaire CRISPR sont utilisées pour modifier spécifiquement ou réduire au silence les gènes et inhiber la production de protéines.
L'un de ces outils de biologie moléculaire est le CRISPRi (de "CRISPR interference"). CRISPRi bloque les gènes et leur expression sans modifier la séquence d'ADN. Comme le système CRISPR-Cas, également connu sous le nom de "ciseaux à gènes", cet outil fait intervenir un acide ribonucléique (ARN), qui sert d'ARN guide pour diriger une nucléase (Cas). Contrairement aux ciseaux à gènes, la nucléase CRISPRi ne fait que se lier à l'ADN sans le couper. Cette liaison fait que le gène correspondant n'est pas transcrit et reste donc silencieux.
Jusqu'à présent, il était difficile de prédire les performances de cette méthode pour un gène spécifique. Des chercheurs de l'Institut Helmholtz de Würzburg pour la recherche sur les infections à ARN (HIRI), en collaboration avec l'université de Würzburg et l'unité de coopération Helmholtz pour l'intelligence artificielle (Helmholtz AI), ont mis au point une approche d'apprentissage automatique utilisant l'intégration de données et l'intelligence artificielle (AI) afin d'améliorer ces prédictions à l'avenir.
L'approche
Les cribles CRISPRi sont un outil très sensible qui peut être utilisé pour étudier les effets d'une réduction de l'expression des gènes. Dans leur étude, publiée dans la revue Genome Biology, les scientifiques ont utilisé des données provenant de multiples cribles d'essentialité CRISPRi à l'échelle du génome pour entraîner une approche d'apprentissage automatique. Leur objectif : mieux prédire l'efficacité des ARN guides modifiés déployés dans le système CRISPRi.
"Malheureusement, les cribles à l'échelle du génome ne fournissent que des informations indirectes sur l'efficacité des guides. Nous avons donc appliqué une nouvelle méthode d'apprentissage automatique qui permet de distinguer l'efficacité de l'ARN guide de l'impact du gène réduit au silence", explique Lars Barquist. Ce biologiste informatique est à l'origine de l'étude et dirige un groupe de recherche en bioinformatique à l'Institut Helmholtz de Würzburg, un site du Centre Helmholtz de Braunschweig pour la recherche sur les infections, en coopération avec l'Université Julius-Maximilians de Würzburg.
Soutenue par des outils d'IA supplémentaires ("Explainable AI"), l'équipe a établi des règles de conception compréhensibles pour les futures expériences CRISPRi. Les auteurs de l'étude ont validé leur approche en réalisant un criblage indépendant ciblant des gènes bactériens essentiels, montrant que leurs prédictions étaient plus précises que les méthodes précédentes.
"Les résultats ont montré que notre modèle surpasse les méthodes existantes et fournit des prédictions plus fiables des performances de CRISPRi lorsqu'il s'agit de cibler des gènes spécifiques", déclare Yanying Yu, doctorant dans le groupe de recherche de Lars Barquist et premier auteur de l'étude.
Les scientifiques ont été particulièrement surpris de constater que l'ARN guide lui-même n'est pas le principal facteur déterminant la déplétion de CRISPRi dans les cribles d'essentialité. "Certaines caractéristiques propres au gène et liées à son expression semblent avoir un impact plus important que ce que l'on pensait auparavant", explique Yu.
L'étude révèle également que l'intégration de données provenant de plusieurs ensembles de données améliore considérablement la précision de la prédiction et permet une évaluation plus fiable de l'efficacité des ARN guides. "Il est essentiel d'élargir nos données d'entraînement en rassemblant plusieurs expériences pour créer de meilleurs modèles de prédiction. Avant notre étude, le manque de données était un facteur limitant majeur pour la précision de la prédiction", résume le professeur junior Barquist. L'approche publiée aujourd'hui sera très utile pour planifier des expériences CRISPRi plus efficaces à l'avenir et servira à la fois la biotechnologie et la recherche fondamentale. "Notre étude fournit un modèle pour le développement d'outils plus précis permettant de manipuler l'expression des gènes bactériens et, en fin de compte, de mieux comprendre et combattre les agents pathogènes", déclare M. Barquist.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.
Publication originale
Yanying Yu, Sandra Gawlitt, Lisa Barros de Andrade e Sousa, Erinc Merdivan, Marie Piraud, Chase L. Beisel, Lars Barquist; "Improved prediction of bacterial CRISPRi guide efficiency from depletion screens through mixed-effect machine learning and data integration"; Genome Biology, Volume 25, 2024-1-11