Le complet humain génome la séquence des deux chromosomes X et des autosomes de la lignée cellulaire dérivée du tissu féminin est terminée. Cela comprend les 8% des génome séquence qui manquait dans la version originale publiée en 2001.
Le complet humain génome La séquence de l'ensemble des 3.055 milliards de paires de bases a été révélée par le Consortium Telomere-to-Telomere (T2T). Cela représente la plus grande amélioration du humain référence génome publié en 2001 par Celera Genomics et l'International Humain Génome Consortium de séquençage. Que génome La séquence couvrait la plupart des régions euchromatiques tout en laissant de côté les régions hétérochromatiniennes ou en présentant une représentation erronée. Ces régions représentent 8% de la humain génome cela a finalement été révélé. La nouvelle référence T2T-CHM131 comprend une séquence complète pour les 22 autosomes plus le chromosome X. Cette nouvelle séquence de référence a également corrigé de nombreuses erreurs et a ajouté environ 200 millions de pb de nouvelles séquences contenant 2,226 115 copies de gènes, dont XNUMX devraient être des protéines codantes.
Le génome de référence GRCh38.p13 actuel est le résultat de deux mises à jour majeures, l'une en 2013 et l'autre en 2019 sur la séquence du génome Celera de 2001. Cependant, il contenait encore 151 millions de paires de bases de séquence inconnue réparties dans tout le monde. génome, y compris les régions péricentromériques et sous-télomériques, les duplications, les réseaux de gènes et d'ADN ribosomique (ADNr), qui sont tous nécessaires aux processus cellulaires fondamentaux. La nouvelle référence a été nommée T2T-CHM13 car elle provient du séquençage de l'ADN de la lignée cellulaire CHM13 (Complete Hydatiform Mole) et est réalisée par le consortium T2T. La lignée cellulaire est dérivée d'un ovule fécondé anormal ou d'une prolifération de tissus provenant du placenta dans lequel la femme semble être enceinte (fausse grossesse), la séquence ne représente donc que les deux chromosomes X et les autosomes de la femme. Plusieurs technologies de séquence ont été utilisées, telles que les séquenceurs PacBio, Oxford Nanopore, 100X et 70X Illumina, pour n'en nommer que quelques-unes. Les avancées technologiques en matière de séquençage ont conduit au séquençage des 8 % restants comme mentionné ci-dessus.
La seule limitation de la séquence T2T-CHM13 est l'absence d'un chromosome Y. Ce séquençage est actuellement en cours, en utilisant l'ADN de la lignée cellulaire HG002, qui possède un 46 (23 paires) avec un caryotype XY. La séquence sera ensuite assemblée en utilisant les mêmes méthodes développées pour le génome homozygote CHM13.
La disponibilité de T2T-CHM13 comme nouvelle référence génome représente une percée majeure qui aidera à comprendre le rôle des régions d'hétérochromatine et à mieux comprendre ses effets sur les processus cellulaires. Jusqu'à ce que le séquençage du chromosome Y soit terminé, celui-ci servira de génome de référence pour de futures études visant à comprendre les processus et les fonctions cellulaires.
***
Références
- Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A et al. La séquence complète d'un humain génome bioRxiv 2021.05.26.445798 ; EST CE QUE JE: https://doi.org/10.1101/2021.05.26.445798
***