바이오 대표

[scRNAseq 논문] 싱글셀 Seurat v4 (“Integrated analysis of multimodal single-cell data” 2021 본문

논문

[scRNAseq 논문] 싱글셀 Seurat v4 (“Integrated analysis of multimodal single-cell data” 2021

바이오 대표 2023. 3. 13. 07:15

 

Introduction

Mutimodals 을 이용한 싱글셀 분석. 해당 논문에서는 “weighted-nearest neighbor(WNN)” 을 이용하여 integrate multiple data types (joint definition of cellular states)를 구한다. WNN 은 각 cell-specific modality weights를 구하는 unsupervised learning 이다.

 

 

Results

대부분 CITE-seq을 기준으로 진행하였다. CITE-seq을 이용하면 scRNAseq 데이터와 세포 표면에 붙어있는 protein들의 정보를 알 수 있다.

  • 여러 modality를 이용했을때, 각 세포를 더 잘 reflect 할 수 있는 modality 에 더 큰 weight 부여해서 합침으로 clustering 을 더 잘할 수 있다. 

CD8+, CD4+ cell이 transcriptomic 에서는 뭉쳐져있는데 (A), protein 데이터 이용했을 때 구분 가능(B) 한것을 확인 할 수 있다. cell specific modality weight 를 확인해보면, CD8+, CD4+ 의 protein modality weight 가 높게 측정된것을 확인 할 수 있다.

  • WNN analysis 를 이용하면 Gussian noise, 다른 k number 을 이용해도 robust 한 결과 얻을 수 있고, 또한 CITE-seq 뿐아니라 scATACseq + scRNAseq 과 같은 multimodals 에서도 적용 가능.
  • Flow cytometry 를 이용했을 때와도 결과가 비슷하다. 
  • 여러 modal 을 이용함으로써, 좀 더 자세하게 heterogeneity를 구분할 수 있었다. 
  • 하나의 modal 을 reference 로 놓고 다른 modal을 annotation 할 수 있다.

 

Workflow (standard Seurat)

  1. Normalization (log-normalization, scran, SCTransform)
  2. Feature selection
  3. Dimensional reduction with PCA → construct KNN graph
  4. (Integration)
    1. WNN  https://satijalab.org/seurat/articles/weighted_nearest_neighbor_analysis.html
    2. Anchor https://satijalab.org/seurat/articles/integration_introduction.html#introduction-to-scrna-seq-integration-1

 

 

Integrate Data (WNN - weighted nearest neighbor)

** KNN graph 값이 있으면, 어떤 데이터이든 WNN 적용 가능하다.

 

1. 각 modality 마다 k-nearest neighbor graph를 구한다. (default k = 20)

 

2. within modality, across-modality prediction 을 구한다

  2.1.L2 normalized vector, KNN neighbors 구한다.

  2. neighbor 들의 low-dimensional profile의 average를 구한다.

 

3. cell-specific modality weights 를 구한다.

 

  3.1 neighbor들을 이용해서 average 한 값과 실제 ri, pi 값 과의 similarity 를 계산한다. (Euclidean distance(d) → UMAP 에서 사용하는 affinities 로 변환 이때 가장 가까운 first nearest neighbor , local connectivity 는 exp를 하게되면 inflate 되어서 제거해 주었다. McInnes et al. (2018))

  3.2 각 세포의 RNA 와 protein neighbors affinities의 ratio를 구한다. 비율이 클수록, 뚜렷한 molecular state를 reflect 한다.

 

  3.3 해당 ratio를, softmax transofmation 으로 normalize 한다. (non-negative, sum to 1). 해당 값은 cell-specific modality weights를 의미하고, modality 마다의 cell weights 가 구해진다

 

4. WNN graph를 계산한다.

 

위에서 계산한 cell specific modality weights를 이용하여, 여러 modality 를 합쳐주면서, 세포간들의 새로운 similarity 를 구한다. 해당 wieghted similarity를 이용하여, WNN graph를 그려줄 수 있다.