Découvertes extraites de l'ADN humain ancien.
13 janvier 2024
Cet article a été examiné selon le processus éditorial et les politiques de Science X. Les rédacteurs ont mis en évidence les attributs suivants tout en garantissant la crédibilité du contenu :
- vérifié
- publication évaluée par les pairs
- source fiable
- corrigé
par l'Université de Copenhague
Quatre articles de recherche publiés dans Nature retracent l'origine génétique et géographique de maladies humaines remontant très loin dans le temps. Les analyses fournissent des images détaillées de la diversité et de la migration humaines préhistoriques, tout en proposant une explication à l'augmentation du risque génétique de sclérose en plaques.
En analysant les données provenant du plus grand ensemble de données à ce jour sur 5 000 génomes humains anciens d'Europe et d'Asie occidentale (Eurasie), de nouvelles recherches ont révélé en détail les pools génétiques humains préhistoriques de l'Eurasie occidentale.
Les résultats sont présentés dans quatre articles publiés dans le même numéro de Nature par une équipe internationale de chercheurs dirigée par des experts de l'Université de Copenhague avec la participation d'environ 175 chercheurs d'universités et de musées au Royaume-Uni, aux États-Unis, en Allemagne, en Australie, en Suède, au Danemark, en Norvège, en France, en Pologne, en Suisse, en Arménie, en Ukraine, en Russie, au Kazakhstan et en Italie. Les nombreux chercheurs représentent un large éventail de disciplines scientifiques, notamment l'archéologie, la biologie évolutive, la médecine, la recherche en ADN ancien, la recherche sur les maladies infectieuses et l'épidémiologie.
Les découvertes issues de la recherche présentées dans les articles de Nature sont basées sur des analyses d'un sous-ensemble des 5 000 génomes et comprennent :
L'ensemble de données sans précédent de 5 000 génomes humains anciens a été reconstitué grâce à l'analyse d'os et de dents mis à disposition par un partenariat scientifique avec des musées et des universités à travers l'Europe et l'Asie occidentale. L'effort de séquençage a été réalisé grâce à la puissance de la technologie Illumina.
L'âge des spécimens va du Mésolithique et Néolithique à l'âge du Bronze, à l'âge du Fer, à la période des Vikings jusqu'au Moyen Âge. Le génome le plus ancien de l'ensemble de données provient d'un individu qui vivait il y a environ 34 000 ans.
« L'objectif initial du projet de génomes humains anciens était de reconstituer 1 000 génomes humains anciens d'Eurasie en tant qu'outil de précision novateur pour la recherche sur les troubles cérébraux », déclarent les trois professeurs de l'Université de Copenhague, qui ont élaboré l'idée de l'ensemble de données d'ADN en 2018 et en ont initialement défini le concept : Eske Willerslev, expert en analyse d'ADN ancien conjointement à l'Université de Cambridge et directeur du projet ; Thomas Werge, expert en facteurs génétiques sous-jacents aux troubles mentaux et responsable de l'Institut de psychiatrie biologique des services de santé mentale de la région de la capitale du Danemark ; et Rasmus Nielsen, expert en analyses statistiques et computationnelles de l'ADN ancien, conjointement à l'Université de Californie, à Berkeley, aux États-Unis.
L'objectif était de produire un ensemble de données génomiques anciennes unique pour étudier les traces et l'histoire évolutive génétique des troubles cérébraux aussi loin dans le temps que possible afin d'acquérir de nouvelles connaissances médicales et biologiques sur ces troubles. Cela devait être accompli en comparant les informations des profils d'ADN ancien avec des données provenant de plusieurs autres disciplines scientifiques.
Les trois professeurs ont ensuite sollicité en 2018 la Fondation Lundbeck, une importante fondation de recherche danoise, pour financer la compilation de l'ensemble de données d'ADN spécifique. Ils ont obtenu une subvention de recherche de cinq ans d'un montant total de 60 millions de couronnes danoises (environ 8 millions d'euros) pour le projet, qui devait être coordonné à l'Université de Copenhague via un nouveau centre établi, baptisé ultérieurement le Centre de géogénétique de la Fondation Lundbeck.
« La justification de l'octroi d'une telle subvention de recherche à ce projet, comme l'a fait la Fondation Lundbeck en 2018, était que si cela fonctionnait, cela représenterait un moyen novateur d'approfondir notre compréhension de l'évolution de l'architecture génétique sous-jacente aux troubles cérébraux au fil du temps. Et les troubles cérébraux sont notre domaine de recherche spécifique », déclare Jan Egebjerg, directeur de la recherche à la Fondation Lundbeck.
La Fondation Lundbeck soutient également le consortium iPYSCH, l'une des plus grandes études mondiales sur les causes génétiques et environnementales des troubles mentaux tels que l'autisme, le TDAH, la schizophrénie, le trouble bipolaire et la dépression, où l'accent est également mis sur l'élaboration de profils de risques génétiques pour ces troubles aussi précis que possible.
The results reported in Nature, were substantiated by comparing the ancient genomic data set with de-identified genetic data from the large Danish iPYSCH consortium and DNA profiles from 400,000 present-day individuals registered in UK Biobank.
The premise for the project was experimental, recounts Professor Werge. 'We wanted to collect ancient human specimens to see what we could get out of them, like trying to understand some of the environmental background to how diseases and disorders evolved. As I see it, the fact that the project took on such vast, complex proportions that Nature wanted it described in four articles is quite unique.'
Professor Willerslev comments that compiling the DNA data set posed major logistical challenges. 'We needed access to archaeological specimens of human teeth and bones that we knew were scattered around in museums and other institutions in the Eurasian region, and that called for many collaboration agreements. But once they were in place, things really took off—the data set was booming, and it now exceeds 5,000 ancient human genomes. The size of the data set has tremendously enhanced both the usability and precision of the results.'
Professor Nielsen was responsible for planning the statistical and bioinformatics analyses of the information gleaned from the ancient teeth and bones in laboratories at the University of Copenhagen. And he was dealing with an overwhelming volume of data, in which the DNA was often severely degraded.
'No one had previously analyzed so many ancient genomes. Now we had to find out how to handle such vast data volumes. The problem was that the raw data is very difficult to work with because you end up with many short DNA sequences with many errors, and then those sequences have to be correctly mapped to the right position in the human genome. Plus, there is the issue of contamination from all the microorganisms present on the ancient teeth and bones.
'Imagine having a jigsaw puzzle consisting of millions of pieces mixed up with four other incomplete puzzle sets, and then running all that in the dishwasher for an hour. Piecing it all together afterwards is no easy task. One of the keys to our success in the end was that we teamed up with Dr. Olivier Delanau from the University of Lausanne who developed algorithms to overcome that very problem,' says Professor Nielsen.
Rumors that a large ancient human genome data set was being compiled were soon circulating in scientific circles. And since 2022 interest has been running very high, say Professors Werge, Willerslev and Nielsen. 'We are constantly taking inquiries from researchers all over the globe—especially those investigating diseases—who typically request access to explore the ancient DNA data set.'
The four Nature articles demonstrate that the large data set of 5,000 genomes serves as a precision tool capable of providing new insights into diseases when combined with analyses of present-day human DNA data and inputs from several other research fields.
That in itself is immensely amazing, according to Professor Willerslev. 'There's no doubt that an ancient genomic data set of this size will have applications in many different contexts within disease research. As new scientific discoveries derived from the 5,000-genome data set become published, more data will gradually be made freely available to all researchers. Ultimately, the complete data set will be open access for everyone.'
Journal information: Nature
Provided by University of Copenhagen