바이오 대표

[ 싱글셀 분석 ] cellranger-atac aggr 본문

Bioinformatics/Tools

[ 싱글셀 분석 ] cellranger-atac aggr

바이오 대표 2023. 2. 3. 09:17

 

Cellranger-atac aggr

[1] cellranger-atac count 

[2] cellranger-atac aggr 

 

각각의 GEM well(multiplex data)의 FASTQ 데이터에 cellranger-atac count 를 이용해서 count 를 하고, cellranger-atac aggr를 이용해서 a single peak-barcode matrix 로 합쳐준다. 이때, cellranger에게 aggregation csv 를 이용해 데이터를 주어야 한다. 어떠한 GEM well에 온것인지는 barcode-1, barcode-2 등으로 GEM well suffix(숫자)로 구별할 수 있고 해당 숫자는 Aggregation csv 와 일치한다.

 

Aggregation csv 예시) 

1 library_id fragments cells
2 LV123 /opt/runs/LV123/outs/fragments.tsv.gz /opt/runs/LV123/outs/singlecell.csv
3 LV456 /opt/runs/LV456/outs/fragments.tsv.gz /opt/runs/LV456/outs/singlecell.csv
4 LV789 /opt/runs/LV789/outs/fragments.tsv.gz /opt/runs/LV789/outs/singlecell.csv

 

cellranger-atac aggr 코드 예시) 

$ cellranger-atac aggr  --id=AGG123 \
                        --csv=AGG123_libraries.csv \
                        --normalize=depth \
                        --reference=/home/jdoe/refs/hg19

 

 

By default, sequencing depth 로 인한 batch effect 를 잡기 위해 Depth normalization 을 진행한다. 여러개의 GEM well을 이용했을 때, cellranger-atac aggr pipeline은 데이터를 합치기 전에 자동으로 group 마다 cell 의 average read depth를 같게한다. 왜냐하면 Libraries 가 read depth per cell 과 차이가 많이나면, 세포들이 cell type 이 아니라, library에 의해 clustering 이 되기 때문이다. 이를 batch effect라고도 한다. 싱글셀 데이터에서 batch effect를 야기하는 요소들은여러개지만 sequencing depth는 그중 하나이다. cellranger-atac aggr는 이러한 sequencing bath effect를 normalization 해주지만, 다른 요소들은 아니다. (none option을 통해서 normalization을 사용하지 않아도 된다.)

 

 

 

참고: https://support.10xgenomics.com/single-cell-atac/software/pipelines/latest/using/aggr