Le nouveau pangenome humain pourrait aider à révéler la biologie de chacun.
Plus de 20 ans après que les gens aient aperçu la première ébauche du génome humain, notre livre d'instructions génétiques, les chercheurs ont débloqué le niveau suivant : le pangénome humain.
Dans quatre études publiées le 10 mai dans la revue Nature, les chercheurs décrivent la réalisation, comment le pangénome a été construit et une partie de la nouvelle biologie que les scientifiques en apprennent.
Le livre de référence plus complet, qui comprend presque tout l'ADN de 47 personnes, permettra aux chercheurs d'explorer des types de variation qui n'ont jamais pu être examinés auparavant, tels que de grandes portions d'ADN dupliqué, perdu ou réorganisé. Ce travail pourrait éventuellement révéler plus de détails sur les fondements génétiques des maladies cardiaques, de la schizophrénie et de divers autres troubles et maladies.
Le pangénome ajoute 119 millions de bases d'ADN - les unités porteuses d'informations de l'ADN - qui ne sont pas présentes dans le génome humain existant, appelé le génome de référence. Une grande partie de cet ADN se trouve dans des parties encore jamais explorées du génome contenant de multiples copies de gènes qui sont dupliqués à partir d'originaux ailleurs dans l'ADN.
Ces parties dupliquées changent plus rapidement que les parties non dupliquées du génome, dit Evan Eichler, généticien humain à l'Université de Washington à Seattle et l'un des leaders du Consortium de référence du pangénome humain. De plus, lorsque Eichler et ses collègues ont examiné les types de variants qui se produisent dans ces régions dupliquées, ils ont trouvé "un signal très fort que les mutations qui se produisent sont fondamentalement différentes des [mutations dans] le reste du génome", dit-il.
Certaines de ces régions dupliquées comprennent celles impliquées dans les grands cerveaux humains par rapport à d'autres espèces et d'autres caractères qui distinguent les humains des autres primates. D'autres ont été impliquées dans certaines caractéristiques ou maladies.
À l'inverse, une autre étude a révélé que les bras très courts de certains chromosomes, dont les chromosomes 13, 14 et 21, deviennent de plus en plus semblables les uns aux autres lorsqu'ils échangent de l'ADN. Ces bras courts sont importants car ils contiennent des gènes pour fabriquer des ARN ribosomiques, qui servent de support pour les ribosomes, le mécanisme responsable de la construction de chaque protéine dans le corps.
Mais peut-être le plus grand accomplissement du projet de pangénomique est qu'il donne enfin aux chercheurs un regard plus complet sur l'ensemble de la diversité génétique humaine.
Le génome de référence humain de près de deux décennies provient principalement d'un seul homme, mais est un patchwork de l'ADN de plus de 60 personnes (SN: 3/4/21). Il a été recousu et ajouté au fil des ans, mais il comporte encore des trous.
L'année dernière, le premier génome humain entièrement complet a été annoncé (SN : 3/31/22). Ce génome contient tout l'ADN de bout en bout, du télomère au télomère, de chaque chromosome humain. Sauf que ce génome n'était pas celui d'une personne. Il provenait d'un type de tumeur connue sous le nom de mole hydatiforme. Ces tumeurs inhabituelles résultent lorsqu'un spermatozoïde humain féconde un ovule vide et que les chromosomes du père sont dupliqués.
L'information génétique de telles tumeurs ne représente "même pas une seule personne. Cela vient de la moitié d'une seule personne", dit le généticien humain Timothy O'Connor de l'École de médecine de l'Université du Maryland à Baltimore, qui n'a pas participé à l'un ou l'autre des projets.
Le nouveau brouillon pangénomique provient de personnes réelles et contient presque tout l'ADN de 47 individus anonymes de différentes parties du monde. Cette diversité est importante "car elle nous aide à nous comprendre comme une seule espèce humaine, comme une seule race humaine", dit O'Connor.
La recherche génétique passée a été critiquée pour s'appuyer trop fortement sur l'ADN de personnes d'origine européenne. Étudier une seule population de personnes pourrait signifier manquer des variantes génétiques qui ont surgi dans des populations spécifiques, dit O'Connor. "Avoir une référence pangénomique nous permet d'évaluer cette variation spécifique à la population de manière beaucoup plus détaillée. Et espérons que cela conduira à une meilleure compréhension de la biologie de chacun."
Alors que le pangénome est une grande première étape pour mieux représenter toute la diversité génétique humaine, dit O'Connor, "il manque encore des groupes clés dans le monde. Il sous-représente encore les Latino-Américains et les Amérindiens, et... il n'y a personne inclus en provenance de l'Océanie... Il y a encore beaucoup plus de variation qui doit être ajoutée au pangénome pour être vraiment représentatif de tous."
Plus de diversité arrive, a déclaré la généticienne humaine Karen Miga de l'Université de Californie à Santa Cruz lors d'une conférence de presse le 9 mai. Le consortium prévoit de terminer un total de 350 génomes, y compris ces 47, d'ici mi-2024. La première phase du projet visait à développer la technologie pour construire le pangénome.
Now, the consortium is in talks with Indigenous groups and scientists from around the world about “trying to develop a shared framework, so that it’s not the U.S. trying to set the table. It’s really providing a table and inviting other stakeholders who see the value in creating this type of reference resource to join us,” said Miga, who helped lead the pangenome project.
Having a more complete understanding of human genetic diversity could help researchers begin to unravel the genetic underpinnings of various diseases and disorders.
What’s more, new DNA deciphering technologies have allowed pangenome researchers to examine types of genetic variants that have been difficult to study before.
In particular, duplicated regions of the genome were hard to study because researchers previously could read only short pieces of DNA. There was no way to tell where in the vast puzzle of the human genome those nearly identical pieces fit. Newer “long-read” DNA deciphering, or sequencing, technology makes it possible to read stretches of DNA many thousands of bases long (SN: 2/22/21).
Being able to assess where some people have extra DNA and others are missing DNA, called structural variants, adds a more nuanced view of human genetics, O’Connor says, revealing more of its complexity (SN: 4/10/09).
For instance, researchers used the pangenome map to trace how chromosomes fold up so that different parts are touching each other. Scientists could see some folds and chemical marks in structural variants that may affect how genes are turned on and off. That could affect traits or health. Eichler’s group also mapped one version of a gene that has converted another copy into its own image. These gene conversions were surprisingly common with each person having, on average, more than 2,000 instances of them.
With this more nuanced and complex view of human genetics comes a promise for improved genetics-based medicine. But it may take a while before the pangenome makes a difference in medical clinics, Eichler says.
Researchers hope the pangenome will help them more easily diagnose the genetic changes that contribute to rare diseases and find treatments for common disorders, he says. Once that happens, clinicians may start incorporating data from the pangenome in their practices.