일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- DataFrame
- julia
- CUT&RUN
- single cell
- EdgeR
- single cell analysis
- PYTHON
- CUTandRUN
- github
- ngs
- drug development
- HTML
- matplotlib
- javascript
- drug muggers
- single cell rnaseq
- scRNAseq analysis
- ChIPseq
- cellranger
- scRNAseq
- 비타민 C
- pandas
- Git
- Batch effect
- 싱글셀 분석
- CSS
- python matplotlib
- Bioinformatics
- MACS2
- js
- Today
- Total
바이오 대표
[scRNAseq 논문] 싱글셀 Seurat v4 (“Integrated analysis of multimodal single-cell data” 2021 본문
[scRNAseq 논문] 싱글셀 Seurat v4 (“Integrated analysis of multimodal single-cell data” 2021
바이오 대표 2023. 3. 13. 07:15
Introduction
Mutimodals 을 이용한 싱글셀 분석. 해당 논문에서는 “weighted-nearest neighbor(WNN)” 을 이용하여 integrate multiple data types (joint definition of cellular states)를 구한다. WNN 은 각 cell-specific modality weights를 구하는 unsupervised learning 이다.
Results
대부분 CITE-seq을 기준으로 진행하였다. CITE-seq을 이용하면 scRNAseq 데이터와 세포 표면에 붙어있는 protein들의 정보를 알 수 있다.
- 여러 modality를 이용했을때, 각 세포를 더 잘 reflect 할 수 있는 modality 에 더 큰 weight 부여해서 합침으로 clustering 을 더 잘할 수 있다.
- WNN analysis 를 이용하면 Gussian noise, 다른 k number 을 이용해도 robust 한 결과 얻을 수 있고, 또한 CITE-seq 뿐아니라 scATACseq + scRNAseq 과 같은 multimodals 에서도 적용 가능.
- Flow cytometry 를 이용했을 때와도 결과가 비슷하다.
- 여러 modal 을 이용함으로써, 좀 더 자세하게 heterogeneity를 구분할 수 있었다.
- 하나의 modal 을 reference 로 놓고 다른 modal을 annotation 할 수 있다.
Workflow (standard Seurat)
- Normalization (log-normalization, scran, SCTransform)
- Feature selection
- Dimensional reduction with PCA → construct KNN graph
- (Integration)
Integrate Data (WNN - weighted nearest neighbor)
** KNN graph 값이 있으면, 어떤 데이터이든 WNN 적용 가능하다.
1. 각 modality 마다 k-nearest neighbor graph를 구한다. (default k = 20)
2. within modality, across-modality prediction 을 구한다
2.1.L2 normalized vector, KNN neighbors 구한다.
2. neighbor 들의 low-dimensional profile의 average를 구한다.
3. cell-specific modality weights 를 구한다.
3.1 neighbor들을 이용해서 average 한 값과 실제 ri, pi 값 과의 similarity 를 계산한다. (Euclidean distance(d) → UMAP 에서 사용하는 affinities 로 변환 이때 가장 가까운 first nearest neighbor , local connectivity 는 exp를 하게되면 inflate 되어서 제거해 주었다. McInnes et al. (2018))
3.2 각 세포의 RNA 와 protein neighbors affinities의 ratio를 구한다. 비율이 클수록, 뚜렷한 molecular state를 reflect 한다.
3.3 해당 ratio를, softmax transofmation 으로 normalize 한다. (non-negative, sum to 1). 해당 값은 cell-specific modality weights를 의미하고, modality 마다의 cell weights 가 구해진다
4. WNN graph를 계산한다.
위에서 계산한 cell specific modality weights를 이용하여, 여러 modality 를 합쳐주면서, 세포간들의 새로운 similarity 를 구한다. 해당 wieghted similarity를 이용하여, WNN graph를 그려줄 수 있다.