일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Git
- 싱글셀 분석
- ChIPseq
- HTML
- single cell rnaseq
- github
- scRNAseq analysis
- js
- julia
- Bioinformatics
- python matplotlib
- Batch effect
- pandas
- single cell
- drug muggers
- ngs
- 비타민 C
- javascript
- drug development
- DataFrame
- CSS
- EdgeR
- cellranger
- matplotlib
- PYTHON
- single cell analysis
- CUTandRUN
- scRNAseq
- MACS2
- CUT&RUN
- Today
- Total
바이오 대표
[ Bioinformatics 논문 ] The complete sequence of a human genome 본문
" The complete sequence of a human genome "
Abstract
2000년에 초기 발행한 Human reference genomed은 중요한 이질염색성(heterochromatic) 부분을 제외한 게놈(genome)의 진정염색성(euchromatic) 부분만 포함하고 있다. 나머지 8%는, Telomere-to-Telomere(T2T) Consortium에서 인간 게놈 T2T-CHM13d의 완성된 30.55 억개의 base pair 염기 순서 (sequence)를 보였다. 이는 이전 reference의 에러를 수정한, Y를 제외한 모든 염색체(chromosome)의 끊어짐 없는 서열조립 (gapless assemblies)을 포함하고 있고 1956개의 gene predictions와 protein coding로 추정되는 99개의 포함한 2억 가까이 되는 base pairs를 소개한다. 해당 완성된 부분은 모든 centromeric satellite arrays와 recent segmental duplications 그리고 총 5개의 acrocentric chromosomes 의 short arms 을 포함한다. 이는 변화적이고 기능적인 연구 관련 게놈의 복잡한 부분을 해결하였다.
* heterochromatic vs euchromatic
Background
현재 사용하는 human reference genome 은 2013 Genome Reference Consortium (GRC)에서 공개한 것이고 가장 최신버전은 2019년의 GRCh38.p13 이다. Human Genome Project 를 시작으로 20여녀간 개선되어왔다. GRC assembly는 sequenced bacterial artificial chromosomes (BACs) 로 만들어졌다. 하지만 BAC cloning 의 한계는 반복적인 서열을 표현해내기 어려웠다.
GRCh38 reference assembly 는 알려지지 않은 염기서열 151 mega bp를 포함하고있다. unknown 부분은 pericentromeric, subtelomeric, recent segmental duplications, ampliconic gene arrays 그리고 ribosomal DNA (rDNA) 서열을 포함한다.
Long-read shotgun sequencing 기술로 (PacBio 과 Oxford Nanopore) BAC 기반 assembly 의 한계를 극복할 수 있었다.
* CHM13 의 완성된 암기서열관련 논문은 다음 글을 참고하면 된다.
Nurk, S., Koren, S., Rhie, A., Rautiainen, M., Bzikadze, A. V., Mikheenko, A., Vollger, M. R., Altemose, N., Uralsky, L., Gershman, A., Aganezov, S., Hoyt, S. J., Diekhans, M., Logsdon, G. A., Alonge, M., Antonarakis, S. E., Borchers, M., Bouffard, G. G., Brooks, S. Y., … Phillippy, A. M. (2022). The complete sequence of a human genome. Science, 376(6588), 44–53. https://doi.org/10.1126/science.abj6987