Un territoire inexploré dans le génome humain
Karen Arnott/EMBL-EBI
Lorsque les chercheurs travaillant sur le projet du génome humain ont dressé une carte complète du plan génétique de l'homme en 2001, ils ont été surpris de ne trouver qu'environ 20 000 gènes produisant des protéines. Se pourrait-il que les humains ne possèdent que deux fois plus de gènes qu'une mouche ordinaire ? Les scientifiques s'attendaient à en trouver beaucoup plus.
Aujourd'hui, des chercheurs de 20 institutions du monde entier rassemblent plus de 7 200 segments de gènes non reconnus qui codent potentiellement pour de nouvelles protéines. Pour la première fois, l'étude fait appel à une nouvelle technologie pour trouver des protéines possibles chez l'homme - en examinant en détail les mécanismes de production des protéines dans les cellules. La nouvelle étude suggère que les efforts de découverte de gènes du projet du génome humain n'étaient qu'un début, et le consortium de recherche vise à encourager la communauté scientifique à intégrer les données dans les principales bases de données du génome humain.
L'étude, récemment publiée dans "Nature Biotechnology", a été menée conjointement par le Dr Jorge Ruiz Orera du Centre Max Delbrück de médecine moléculaire de l'Association Helmholtz (MDC) en Allemagne, le Dr Sebastiaan van Heesch du Centre Princesse Máxima d'oncologie pédiatrique aux Pays-Bas, le Dr Jonathan Mudge du Laboratoire européen de biologie moléculaire - Institut européen de bioinformatique (EMBL-EBI) au Royaume-Uni, et le Dr John Prensner du Broad Institute du MIT et de Harvard aux États-Unis.
Les nouvelles séquences génétiques sont restées hors de portée
Au cours des dernières années, des milliers de cadres de lecture ouverts (ORF), souvent très petits, ont été découverts dans le génome humain. Il s'agit de tronçons de séquence d'ADN qui peuvent contenir des instructions pour la construction de protéines. Plusieurs auteurs de l'étude actuelle ont déjà trouvé des ORF et les ont décrits dans des revues scientifiques : Van Heesch, en collaboration avec les professeurs du MDC Norbert Hübner et Uwe Ohler, a décrit de nouvelles mini-protéines dans le cœur humain et en a rendu compte dans "Cell" en 2019 ; Prensner a également publié des ORF dans "Nature Biotechnology" en 2021. Pourtant, aucun de ces segments jusqu'alors pratiquement inexplorés n'a ensuite été inclus dans les bases de données de référence. D'autres séquences ont été rapportées dans des revues telles que "Science" ou "Nature Chemical Biology", mais sont restées largement hors de portée de la plupart des membres de la communauté scientifique - malgré les preuves qu'elles produisent des molécules d'ARN qui se lient ensuite aux ribosomes, les usines à protéines de la cellule.
Traditionnellement, les régions codant pour les protéines dans les gènes ont été identifiées en comparant les séquences d'ADN de plusieurs espèces : les régions codantes les plus importantes ont été préservées au cours de l'évolution animale. Mais cette méthode présente un inconvénient : les régions codantes relativement jeunes, c'est-à-dire apparues au cours de l'évolution des primates, passent à travers les mailles du filet et sont donc absentes des bases de données.
Il s'agit donc maintenant d'intégrer ces ORF largement ignorés dans les plus grandes bases de données de référence, car les chercheurs devaient jusqu'à présent les rechercher spécifiquement dans la littérature s'ils voulaient les étudier.
Dans un premier temps, l'équipe internationale de chercheurs a recueilli des informations sur les séquences découvertes grâce au profilage du ribosome - une technique qui détermine avec quelle partie de l'ARN messager (ARNm) le ribosome interagit. Ils ont ensuite rassemblé les données dans un catalogue standardisé. Ce n'était pas une mince affaire, car il n'est pas possible de combiner simplement des données obtenues de manières très diverses par différents laboratoires.
Une fois cette tâche accomplie, le consortium international s'est penché sur des questions centrales qui définissent notre notion même du génome humain : Qu'est-ce qu'un gène ? Qu'est-ce qu'une protéine ? Avons-nous besoin de notions souples pour savoir si les ribosomes produisent toujours une protéine ou plutôt un autre résultat cellulaire ?
Le groupe demande maintenant que les bases de données sur le génome humain utilisées par les scientifiques du monde entier soient révisées. Ensembl-GENCODE configurent ce catalogue d'ORF comme un composant de leur base de données d'annotation de référence. Cette approche sera soutenue par de nombreuses autres comme UniProt, HGNC, PeptideAtlas et HUPO.
Les ORF jouent probablement un rôle dans les maladies courantes
Le Dr Sebastiaan van Heesch, chef de groupe au Centre Princesse Máxima d'oncologie pédiatrique, déclare : "Notre recherche marque un énorme pas en avant dans la compréhension du patrimoine génétique et du nombre complet de protéines chez l'homme. C'est extrêmement excitant de permettre à la communauté des chercheurs de disposer de notre nouveau catalogue. Il est trop tôt pour dire si toutes les sections inexplorées de l'ADN représentent réellement des protéines, mais nous pouvons clairement voir que quelque chose d'inexploré se produit à travers le génome humain et que le monde devrait y prêter attention."
"Pendant trop longtemps, la communauté scientifique a été principalement laissée dans l'ignorance de ces ORF", déclare Jonathan Mudge de l'EMBL-EBI. "Nous sommes très fiers que notre travail puisse permettre aux chercheurs du monde entier de commencer à les étudier. C'est à ce moment-là qu'ils entrent dans le courant dominant de la génomique et de la science médicale - un effort qui, nous l'espérons, aura des effets d'entraînement de grande ampleur."
"Il est particulièrement remarquable que la plupart de ces 7 200 ORF soient exclusifs aux primates et puissent représenter des innovations évolutives uniques à notre espèce", rapporte Jorge Ruiz-Orera, biologiste évolutionniste travaillant dans le laboratoire de Hübner au MDC. "Cela montre comment ces éléments peuvent fournir des indices importants sur ce qui fait de nous des humains".
Alors, quelle est la prochaine étape ? John Prensner, du Broad Institute du MIT et de Harvard, déclare : "Il est presque certain que ces ORF seront des facteurs contribuant à de nombreuses caractéristiques et maladies humaines, qu'il s'agisse de maladies rares ou de maladies courantes comme le cancer. Le défi consiste maintenant à déterminer quels ORF jouent quel rôle dans quelles maladies."
Note: Cet article a été traduit à l'aide d'un système informatique sans intervention humaine. LUMITOS propose ces traductions automatiques pour présenter un plus large éventail d'actualités. Comme cet article a été traduit avec traduction automatique, il est possible qu'il contienne des erreurs de vocabulaire, de syntaxe ou de grammaire. L'article original dans Anglais peut être trouvé ici.