L'intelligence artificielle permet de concevoir de nouvelles protéines
Un modèle informatique de traitement du langage naturel comprend le langage des protéines et peut l'utiliser de manière créative.
UBT / Chr. Wißler
Les langues naturelles et les protéines ont en fait une structure similaire. Les acides aminés s'arrangent en une multitude de combinaisons pour former des structures qui ont des fonctions spécifiques dans l'organisme vivant - de la même manière que les mots forment des phrases en différentes combinaisons qui expriment certains faits. Ces dernières années, de nombreuses approches ont donc été développées pour utiliser les principes et les processus qui contrôlent le traitement du langage naturel par ordinateur dans la recherche sur les protéines. "Le traitement du langage naturel a fait des progrès extraordinaires grâce aux nouvelles technologies de l'IA. Aujourd'hui, les modèles de traitement du langage permettent aux machines non seulement de comprendre des phrases significatives mais aussi de les générer elles-mêmes. Un tel modèle a été le point de départ de nos recherches. Avec des informations détaillées concernant environ 50 millions de séquences de protéines naturelles, ma collègue Noelia Ferruz a entraîné le modèle et lui a permis de générer des séquences de protéines par lui-même. Il comprend désormais le langage des protéines et peut l'utiliser de manière créative. Nous avons constaté que ces conceptions créatives suivent les principes de base des protéines naturelles", explique le professeur Birte Höcker, chef du groupe de conception des protéines à l'université de Bayreuth.
Le modèle de traitement du langage transféré à l'évolution des protéines s'appelle "ProtGPT2". Il peut désormais être utilisé pour concevoir des protéines qui adoptent des structures stables par repliement et sont en permanence fonctionnelles dans cet état. En outre, les biochimistes de Bayreuth ont découvert, grâce à des investigations complexes, que le modèle peut même créer des protéines qui n'existent pas dans la nature et qui n'ont peut-être jamais existé dans l'histoire de l'évolution. Ces résultats mettent en lumière le monde incommensurable des protéines possibles et ouvrent la voie à leur conception selon des méthodes nouvelles et inexplorées. Il existe un autre avantage : La plupart des protéines qui ont été conçues de novo jusqu'à présent ont des structures idéalisées. Avant que de telles structures puissent avoir une application potentielle, elles doivent généralement passer par un processus de fonctionnalisation élaboré - par exemple en insérant des extensions et des cavités - afin qu'elles puissent interagir avec leur environnement et assumer des fonctions précisément définies dans des contextes systémiques plus larges. ProtGPT2, en revanche, génère des protéines qui possèdent de manière innée de telles structures différenciées, et sont donc déjà opérationnelles dans leurs environnements respectifs.
"Notre nouveau modèle est une autre démonstration impressionnante de l'affinité systémique de la conception de protéines et du traitement du langage naturel. L'intelligence artificielle ouvre des possibilités très intéressantes et prometteuses d'utiliser les méthodes de traitement du langage pour la production de protéines personnalisées. À l'université de Bayreuth, nous espérons contribuer de cette manière à l'élaboration de solutions innovantes pour les problèmes biomédicaux, pharmaceutiques et écologiques", déclare le professeur Birte Höcker.
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.