Des scientifiques utilisent la biologie quantique et l'IA pour affiner l'outil d'édition du génome
cette étude représente une avancée passionnante vers la compréhension de la manière dont nous pouvons éviter de faire des "fautes de frappe" coûteuses dans le code génétique d'un organisme
CRISPR est un outil puissant pour la bio-ingénierie, utilisé pour modifier le code génétique afin d'améliorer les performances d'un organisme ou de corriger des mutations. L'outil CRISPR Cas9 repose sur un seul et unique ARN guide qui indique à l'enzyme Cas9 de se lier au site ciblé correspondant dans le génome et de le cliver. Les modèles existants permettant de prédire par calcul les ARN guides efficaces pour les outils CRISPR ont été construits à partir de données provenant de quelques espèces modèles seulement, avec une efficacité faible et incohérente lorsqu'ils sont appliqués aux microbes.
"Beaucoup d'outils CRISPR ont été développés pour les cellules de mammifères, les mouches des fruits ou d'autres espèces modèles. Peu d'entre eux ont été conçus pour les microbes, dont les structures chromosomiques et la taille sont très différentes", explique Carrie Eckert, chef du groupe de biologie synthétique à l'ORNL. "Nous avions observé que les modèles de conception de la machinerie CRISPR Cas9 se comportaient différemment lorsqu'on travaillait avec des microbes, et cette recherche valide ce que nous savions de manière anecdotique."
Pour améliorer la modélisation et la conception de l'ARN guide, les scientifiques de l'ORNL ont cherché à mieux comprendre ce qui se passe au niveau le plus élémentaire dans les noyaux cellulaires, où le matériel génétique est stocké. Ils se sont tournés vers la biologie quantique, un domaine qui relie la biologie moléculaire et la chimie quantique et qui étudie les effets que la structure électronique peut avoir sur les propriétés chimiques et les interactions des nucléotides, les molécules qui forment les éléments constitutifs de l'ADN et de l'ARN.
La façon dont les électrons sont distribués dans la molécule influence la réactivité et la stabilité conformationnelle, y compris la probabilité que le complexe enzyme Cas9-ARN guide se lie efficacement à l'ADN du microbe, a déclaré Erica Prates, biologiste des systèmes computationnels à l'ORNL.
Le meilleur guide dans une forêt de décisions
Les scientifiques ont construit un modèle d'intelligence artificielle explicable appelé forêt aléatoire itérative. Ils ont entraîné le modèle sur un ensemble de données d'environ 50 000 ARN guides ciblant le génome de la bactérie E. coli, tout en tenant compte des propriétés chimiques quantiques, selon une approche décrite dans la revue Nucleic Acids Research.
Le modèle a révélé des caractéristiques clés sur les nucléotides qui peuvent permettre la sélection de meilleurs ARN guides. "Le modèle nous a permis d'identifier des indices sur les mécanismes moléculaires qui sous-tendent l'efficacité de nos ARN guides", a déclaré M. Prates, "ce qui nous donne une riche bibliothèque d'informations moléculaires qui peuvent nous aider à améliorer la technologie CRISPR".
Les chercheurs de l'ORNL ont validé le modèle de l'IA explicable en réalisant des expériences de coupe CRISPR Cas9 sur E. coli avec un grand groupe de guides sélectionnés par le modèle.
L'utilisation de l'IA explicable a permis aux scientifiques de comprendre les mécanismes biologiques à l'origine des résultats, plutôt qu'un modèle d'apprentissage profond ancré dans un algorithme "boîte noire" qui manque d'interprétabilité, a déclaré Jaclyn Noshay, une ancienne biologiste des systèmes informatiques de l'ORNL qui est le premier auteur de l'article.
"Nous voulions améliorer notre compréhension des règles de conception des guides pour une efficacité de coupe optimale avec un accent sur les espèces microbiennes, étant donné que nous connaissons l'incompatibilité des modèles formés à travers les règnes [biologiques]", a déclaré Jaclyn Noshay.
Le modèle d'IA explicable, avec ses milliers de caractéristiques et sa nature itérative, a été entraîné à l'aide du superordinateur Summit de l'Oak Ridge Leadership Computer Facility (OLCF) de l'ORNL, une installation d'utilisateurs du DOE Office of Science.
Mme Eckert a indiqué que son équipe de biologie synthétique prévoit de collaborer avec des collègues de l'ORNL spécialisés dans les sciences informatiques afin d'utiliser ce qu'ils ont appris avec le nouveau modèle CRISPR Cas9 microbien et de l'améliorer en utilisant des données provenant d'expériences de laboratoire ou d'une variété d'espèces microbiennes.
De meilleurs outils CRISPR Cas9 pour chaque espèce
La prise en compte des propriétés quantiques ouvre la voie à l'amélioration des guides Cas9 pour toutes les espèces. "Cet article a même des implications à l'échelle humaine", a déclaré M. Eckert. "Si vous envisagez de développer un médicament, par exemple, en utilisant CRISPR pour cibler une région spécifique du génome, vous devez disposer du modèle le plus précis pour prédire ces guides.
En affinant les modèles CRISPR Cas9, les scientifiques disposent d'un pipeline à plus haut débit pour relier le génotype au phénotype, ou les gènes aux caractéristiques physiques, un domaine connu sous le nom de génomique fonctionnelle. La recherche a des implications pour les travaux du Centre d'innovation en bioénergie (CBI) dirigé par l'ORNL, par exemple, pour améliorer les plantes productrices de bioénergie et la fermentation bactérienne de la biomasse.
"Cette recherche nous permet d'améliorer considérablement nos prévisions concernant l'ARN guide", a déclaré M. Eckert. "Plus nous comprenons les processus biologiques en jeu et plus nous pouvons intégrer de données dans nos prédictions, plus nos cibles seront performantes, ce qui améliorera la précision et la rapidité de nos recherches.
"L'un des principaux objectifs de notre recherche est d'améliorer la capacité à modifier de manière prédictive l'ADN d'un plus grand nombre d'organismes à l'aide des outils CRISPR. Cette étude représente une avancée passionnante vers la compréhension de la manière dont nous pouvons éviter de faire des 'fautes de frappe' coûteuses dans le code génétique d'un organisme", a déclaré Paul Abraham, chimiste bioanalytique à l'ORNL, qui dirige le Secure Ecosystem Engineering and Design Science Focus Area, ou SEED SFA, du DOE Genomic Science Program, qui a soutenu la recherche CRISPR. "Je suis impatient de voir comment ces prédictions peuvent encore s'améliorer à mesure que nous générons des données d'entraînement supplémentaires et que nous continuons à tirer parti de la modélisation de l'IA explicable.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.
Publication originale
Jaclyn M Noshay, Tyler Walker, William G Alexander, Dawn M Klingeman, Jonathon Romero, Angelica M Walker, Erica Prates, Carrie Eckert, Stephan Irle, David Kainer, Daniel A Jacobson; "Quantum biological insights into CRISPR-Cas9 sgRNA efficiency from explainable-AI driven feature engineering"; Nucleic Acids Research, Volume 51, 2023-9-20