L'intelligence artificielle permet de développer de nouveaux médicaments
Les chimistes ont testé le processus en utilisant la borylation - une réaction qui active les échafaudages d'hydrocarbures
Les nouveaux principes actifs pharmaceutiques constituent la base de traitements médicaux innovants et de meilleure qualité. Mais les identifier et surtout les produire par synthèse chimique en laboratoire n'est pas une mince affaire. Pour trouver le processus de production optimal, les chimistes procèdent généralement par essais et erreurs : ils déduisent les méthodes possibles de synthèse en laboratoire à partir des réactions chimiques connues et les testent ensuite par des expériences ; une approche qui prend beaucoup de temps et qui est parsemée d'impasses.
Des scientifiques de l'ETH Zurich, en collaboration avec des chercheurs de Roche Pharma Research and Early Development, ont mis au point une approche basée sur l'intelligence artificielle (IA) qui permet de déterminer la meilleure méthode de synthèse, y compris sa probabilité de succès. "Notre méthode peut réduire considérablement le nombre d'expériences de laboratoire nécessaires", explique Kenneth Atz, qui a développé le modèle d'IA en tant que doctorant avec le professeur Gisbert Schneider à l'Institut des sciences pharmaceutiques de l'ETH Zurich.
Les ingrédients pharmaceutiques actifs sont généralement constitués d'un échafaudage sur lequel sont fixés des groupes fonctionnels. Ce sont ces derniers qui confèrent à la substance sa fonction biologique hautement spécifique. Le rôle de l'échafaudage est d'amener les groupes fonctionnels dans un alignement géométrique défini afin qu'ils puissent agir de manière ciblée. Imaginez un kit de construction de grue, dans lequel un cadre d'éléments de connexion est boulonné de manière à ce que les ensembles fonctionnels tels que les rouleaux, les treuils à câble, les roues et la cabine du conducteur soient correctement disposés les uns par rapport aux autres.
Introduire des fonctions chimiques
L'une des façons de produire des médicaments ayant un effet médicinal nouveau ou amélioré consiste à placer des groupes fonctionnels sur de nouveaux sites des échafaudages. Cela peut sembler simple, et ne poserait certainement pas de problème sur un modèle de grue, mais c'est particulièrement difficile en chimie. En effet, les échafaudages, principalement composés d'atomes de carbone et d'hydrogène, sont eux-mêmes pratiquement non réactifs, ce qui rend difficile leur liaison avec des atomes fonctionnels tels que l'oxygène, l'azote ou le chlore. Pour y parvenir, les échafaudages doivent d'abord être activés chimiquement par des réactions de détour.
La borylation est une méthode d'activation qui ouvre de nombreuses possibilités pour différents groupes fonctionnels, du moins sur le papier. Dans ce processus, un groupe chimique contenant l'élément bore est lié à un atome de carbone dans l'échafaudage. Le groupe bore peut ensuite être simplement remplacé par toute une série de groupes médicalement efficaces.
Des données provenant de sources fiables et d'un laboratoire automatisé
"Bien que la borylation ait un grand potentiel, la réaction est difficile à contrôler en laboratoire. C'est pourquoi notre recherche exhaustive dans la littérature mondiale n'a abouti qu'à un peu plus de 1 700 articles scientifiques sur le sujet", explique M. Atz en décrivant le point de départ de son travail.
L'idée était de prendre les réactions décrites dans la littérature scientifique et de les utiliser pour entraîner un modèle d'IA, que l'équipe de recherche pourrait ensuite utiliser pour examiner de nouvelles molécules et identifier le plus grand nombre possible de sites sur celles-ci où la borylation serait possible. Cependant, les chercheurs n'ont finalement nourri leur modèle qu'avec une fraction de la littérature qu'ils avaient trouvée. Pour s'assurer que le modèle n'était pas induit en erreur par de faux résultats issus d'une recherche négligente, l'équipe s'est limitée à 38 articles particulièrement dignes de confiance. Ceux-ci décrivaient un total de 1 380 réactions de borylation.
Pour élargir l'ensemble des données d'entraînement, l'équipe a complété les résultats de la littérature par des évaluations de 1 000 réactions effectuées dans le laboratoire automatisé du département de recherche en chimie médicinale de Roche. Cela permet d'effectuer de nombreuses réactions chimiques à l'échelle du milligramme et de les analyser simultanément. "La combinaison de l'automatisation des laboratoires et de l'IA offre un potentiel énorme pour accroître considérablement l'efficacité de la synthèse chimique tout en améliorant la durabilité", explique David Nippa, un doctorant de Roche qui a réalisé le projet avec Atz.
Un pouvoir prédictif élevé, en particulier avec des données 3D
Les capacités prédictives du modèle généré à partir de ce pool de données ont été vérifiées à l'aide de six molécules médicamenteuses connues. Dans cinq cas sur six, des tests expérimentaux en laboratoire ont confirmé les sites supplémentaires prédits. Le modèle s'est avéré tout aussi fiable lorsqu'il s'est agi d'identifier les sites de l'échafaudage où l'activation n'est pas possible. De plus, il a permis de déterminer les conditions optimales pour les réactions d'activation.
Il est intéressant de noter que les prédictions se sont encore améliorées lorsque des informations 3D sur les matériaux de départ ont été incluses au lieu de se limiter à leurs formules chimiques bidimensionnelles. "Il semble que le modèle développe une sorte de compréhension chimique tridimensionnelle", explique M. Atz.
Le taux de réussite des prédictions a également impressionné les chercheurs de Roche Pharma Research and Early Development. Entre-temps, ils ont utilisé avec succès la méthode pour identifier les sites dans les médicaments existants où des groupes actifs supplémentaires peuvent être introduits. Cela leur permet de développer plus rapidement de nouvelles variantes plus efficaces d'ingrédients pharmaceutiques actifs connus.
D'autres activations et fonctionnalisations en ligne de mire
Atz et Schneider voient de nombreuses autres applications possibles pour les modèles d'IA basés sur une combinaison de données provenant d'une littérature fiable et d'expériences menées dans un laboratoire automatisé. Par exemple, cette approche devrait permettre de créer des modèles efficaces pour des réactions d'activation autres que la borylation. L'équipe espère également pouvoir identifier un plus grand nombre de réactions permettant de fonctionnaliser davantage les sites borylés.
Atz participe désormais à ces travaux de développement en tant que chercheur en IA dans le domaine de la chimie médicinale chez Roche : "Il est très intéressant de travailler à l'interface de la recherche universitaire en IA et de l'automatisation des laboratoires. Et c'est un plaisir de pouvoir faire avancer les choses avec le meilleur contenu et les meilleures méthodes". Schneider ajoute : "Ce projet innovant est un autre exemple remarquable de collaboration entre le monde universitaire et l'industrie et démontre l'énorme potentiel des partenariats public-privé pour la Suisse."
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.
Publication originale
David F. Nippa, Kenneth Atz, Remo Hohler, Alex T. Müller, Andreas Marx, Christian Bartelmus, Georg Wuitschik, Irene Marzuoli, Vera Jost, Jens Wolfard, Martin Binder, Antonia F. Stepan, David B. Konrad, Uwe Grether, Rainer E. Martin, Gisbert Schneider; "Enabling late-stage drug diversification by high-throughput experimentation with geometric deep learning"; Nature Chemistry, 2023-11-23