Un "ChatGPT chimique" pour les nouveaux médicaments

L'IA apprend les liens chimiques

25.10.2024
© Sanjana Srinivasan & Jürgen Bajorath

Structures tridimensionnelles de deux protéines cibles, l'histone désacétylase 6 (bleu) et la tyrosine-protéine kinase JAK2 (rouge), ainsi qu'un inhibiteur sélectif de chaque enzyme. L'inhibiteur double au centre est actif contre les deux cibles. La prédiction des composés ayant une activité prédéfinie sur les deux cibles est la tâche du modèle de langage chimique.

Des chercheurs de l'université de Bonn ont formé un processus d'IA pour prédire les ingrédients actifs potentiels ayant des propriétés particulières. Ils ont ainsi dérivé un modèle de langage chimique - une sorte de ChatGPT pour les molécules. Après une phase d'entraînement, l'IA a été en mesure de reproduire exactement les structures chimiques de composés ayant une activité connue à double cible et pouvant constituer des médicaments particulièrement efficaces. L'étude a été publiée dans Cell Reports Physical Science.

Quiconque souhaite faire plaisir à sa grand-mère en lui écrivant un poème pour son 90e anniversaire n'a pas besoin d'être poète de nos jours : Il suffit d'une courte demande dans ChatGPT et, en quelques secondes, l'IA produit une longue liste de mots qui riment avec le nom de la personne qui fête son anniversaire. Elle peut même produire un sonnet si vous le souhaitez.

Des chercheurs de l'université de Bonn ont mis en œuvre un modèle similaire dans leur étude, connu sous le nom de modèle de langage chimique. Ce modèle ne produit toutefois pas de rimes. Au lieu de cela, l'IA affiche les formules structurelles de composés chimiques susceptibles de présenter une propriété particulièrement intéressante : Ils sont capables de se lier à deux protéines cibles différentes. Dans l'organisme, cela signifie, par exemple, qu'ils peuvent inhiber deux enzymes à la fois.

Recherchés : Des principes actifs à double effet

"Dans la recherche pharmaceutique, ces types de composés actifs sont très recherchés en raison de leur polypharmacologie", explique le professeur Jürgen Bajorath. L'expert en chimie computationnelle dirige le domaine de l'IA dans les sciences de la vie à l'Institut Lamarr pour l'apprentissage automatique et l'intelligence artificielle et le programme d'informatique des sciences de la vie à b-it (Bonn-Aachen International Center for Information Technology) à l'université de Bonn. "Comme les composés ayant une activité multicible souhaitable influencent simultanément plusieurs processus intracellulaires et voies de signalisation, ils sont souvent particulièrement efficaces, par exemple dans la lutte contre le cancer. En principe, cet effet peut également être obtenu par la co-administration de différents médicaments. Cependant, il existe un risque d'interactions médicamenteuses indésirables et les différents composés sont souvent décomposés à des rythmes différents dans l'organisme, ce qui rend leur administration simultanée difficile.

Trouver une molécule qui influence spécifiquement l'effet d'une seule protéine cible n'est pas une tâche facile. Concevoir des composés qui ont un double effet prédéfini est encore plus compliqué. Les modèles de langage chimique pourraient s'avérer utiles à l'avenir. ChatGPT est formé à partir de milliards de pages de texte écrit et apprend à formuler lui-même des phrases. Les modèles de langage chimique fonctionnent de manière similaire, mais ne disposent que de très petites quantités de données pour l'apprentissage. Toutefois, en principe, ils sont également alimentés par des textes, tels que les chaînes SMILES, qui présentent les molécules organiques et leur structure sous la forme d'une séquence de lettres et de symboles. "Nous avons maintenant entraîné notre modèle de langage chimique avec des paires de chaînes", explique Sanjana Srinivasan, du groupe de recherche de Bajorath. "L'une des chaînes décrit une molécule dont nous savons qu'elle n'agit que sur une seule protéine cible. L'autre représentait un composé qui, en plus de cette protéine, influence également une deuxième protéine cible."

L'IA apprend les liens chimiques

Le modèle a été alimenté avec plus de 70 000 de ces paires. Cela lui a permis d'acquérir une connaissance implicite de la manière dont les composés actifs normaux diffèrent de ceux qui ont un double effet. "Lorsque nous l'avons ensuite alimenté avec un composé contre une protéine cible, il a suggéré des molécules sur cette base qui agiraient non seulement contre cette protéine, mais aussi contre une autre", explique M. Bajorath.

Les composés d'entraînement à double effet ciblent souvent des protéines similaires et remplissent donc une fonction similaire dans l'organisme. Cependant, dans la recherche pharmaceutique, on cherche également des ingrédients actifs qui influencent des classes d'enzymes ou de récepteurs complètement différentes. Pour préparer l'IA à cette tâche, un réglage fin a eu lieu après la phase d'apprentissage général. Les chercheurs ont utilisé plusieurs dizaines de paires d'entraînement spéciales pour enseigner à l'algorithme les différentes classes de protéines que les composés suggérés devraient cibler. C'est un peu comme si l'on demandait à ChatGPT de ne pas créer un sonnet cette fois-ci, mais plutôt un limerick.

Après le réglage fin, le modèle a effectivement craché des molécules dont il a déjà été démontré qu'elles agissaient contre les combinaisons souhaitées de protéines cibles. "Cela montre que le processus fonctionne", déclare Bajorath. Selon lui, la force de l'approche ne réside pas dans le fait que de nouveaux composés dépassant l'effet des produits pharmaceutiques disponibles peuvent être immédiatement trouvés. "Il est plus intéressant, de mon point de vue, que l'IA suggère souvent des structures chimiques auxquelles la plupart des chimistes ne penseraient même pas immédiatement", explique-t-il. Dans une certaine mesure, elle déclenche des idées "hors des sentiers battus" et propose des solutions originales qui peuvent déboucher sur de nouvelles hypothèses et approches en matière de conception.

Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.

Publication originale

Autres actualités du département science

Actualités les plus lues

Plus actualités de nos autres portails

Tous les fabricants de spectromètres FT-IR en un coup d'œil