일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- drug development
- scRNAseq
- javascript
- single cell
- EdgeR
- CUT&RUN
- drug muggers
- PYTHON
- github
- pandas
- ChIPseq
- MACS2
- julia
- Bioinformatics
- Git
- ngs
- cellranger
- DataFrame
- CSS
- Batch effect
- matplotlib
- 싱글셀 분석
- python matplotlib
- HTML
- scRNAseq analysis
- single cell rnaseq
- single cell analysis
- 비타민 C
- CUTandRUN
- js
- Today
- Total
바이오 대표
[ 싱글셀 분석 ] cellranger-atac aggr 본문
Cellranger-atac aggr
[1] cellranger-atac count
[2] cellranger-atac aggr
각각의 GEM well(multiplex data)의 FASTQ 데이터에 cellranger-atac count 를 이용해서 count 를 하고, cellranger-atac aggr를 이용해서 a single peak-barcode matrix 로 합쳐준다. 이때, cellranger에게 aggregation csv 를 이용해 데이터를 주어야 한다. 어떠한 GEM well에 온것인지는 barcode-1, barcode-2 등으로 GEM well suffix(숫자)로 구별할 수 있고 해당 숫자는 Aggregation csv 와 일치한다.
Aggregation csv 예시)
1 | library_id | fragments | cells |
2 | LV123 | /opt/runs/LV123/outs/fragments.tsv.gz | /opt/runs/LV123/outs/singlecell.csv |
3 | LV456 | /opt/runs/LV456/outs/fragments.tsv.gz | /opt/runs/LV456/outs/singlecell.csv |
4 | LV789 | /opt/runs/LV789/outs/fragments.tsv.gz | /opt/runs/LV789/outs/singlecell.csv |
cellranger-atac aggr 코드 예시)
$ cellranger-atac aggr --id=AGG123 \
--csv=AGG123_libraries.csv \
--normalize=depth \
--reference=/home/jdoe/refs/hg19
By default, sequencing depth 로 인한 batch effect 를 잡기 위해 Depth normalization 을 진행한다. 여러개의 GEM well을 이용했을 때, cellranger-atac aggr pipeline은 데이터를 합치기 전에 자동으로 group 마다 cell 의 average read depth를 같게한다. 왜냐하면 Libraries 가 read depth per cell 과 차이가 많이나면, 세포들이 cell type 이 아니라, library에 의해 clustering 이 되기 때문이다. 이를 batch effect라고도 한다. 싱글셀 데이터에서 batch effect를 야기하는 요소들은여러개지만 sequencing depth는 그중 하나이다. cellranger-atac aggr는 이러한 sequencing bath effect를 normalization 해주지만, 다른 요소들은 아니다. (none option을 통해서 normalization을 사용하지 않아도 된다.)
참고: https://support.10xgenomics.com/single-cell-atac/software/pipelines/latest/using/aggr
'Bioinformatics > Tools' 카테고리의 다른 글
[ Cut & Tag / Cut & Run ] Cut & Tag 투토리얼 (0) | 2023.03.18 |
---|---|
[ NSG QC / trimming ] TrimGalore (0) | 2023.02.14 |
[NGS scATACseq] scATACseq, Cicero를 이용해서 cis-regulatory gene network 분석하기 (0) | 2022.12.28 |
[NGS scRNAseq] cellranger count 의 output 파일, summary.html 해석 (1) | 2022.12.19 |
[NGS scRNAseq] Chromium 10x Illumina의 기본이해(workflow)와 Cell ranger count (0) | 2022.12.18 |