일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 싱글셀 분석
- cellranger
- scRNAseq
- python matplotlib
- Bioinformatics
- ngs
- single cell rnaseq
- ChIPseq
- single cell analysis
- matplotlib
- Batch effect
- drug development
- Git
- pandas
- scRNAseq analysis
- CUTandRUN
- javascript
- DataFrame
- CSS
- HTML
- CUT&RUN
- js
- single cell
- EdgeR
- julia
- 비타민 C
- MACS2
- github
- PYTHON
- drug muggers
- Today
- Total
목록Bioinformatics/NGS 기본지식 (4)
바이오 대표
- PCA - 해당 글에서는 UMAP 관련해서 좀 자세히 다뤄보려 한다. 다음 내용은 StatQuest 을 참조하였다. UMAP 을 이용해서 High dimension 데이터를 low-dimension에 표현할 수 있다. How? 전체적인 그림은, 낮은차원에서 point를 움직여서, high dimention 에서와 비슷한 모습을 보이도록 조정하는 방법이고 이를 Similarity score 을 계산하여 사용한다. 1. High-dimention points 에서 서로간의 distance 를 계산한다. 2. High-dimention neighbor 숫자 (default 15) 에 따라 log2 (#of neighbor) 을 이용하여 curve 를 그리고, 각 포인트의 similarity score 을 ..
해당 글은 지마님의 블로그의 Batch effect https://ruins880.tistory.com/88 를 참고하였습니다. 좀 더 자세한 사항은 지마님의 블로그를 참고바랍니다. Normalization vs Batch effect correction in scRNAseq Normalization: 라이브러리 제작, dropout, 유전자 길이, GC 비율 등에 따른 증푹 치우침 (amplification bias) - raw count matrix 이용 Batch Effect correction: 실험 설계 및 실험 과정 (시퀀싱 기계, 실험 시각, 시약, 실험실) 에서 오는 변이 통제 - 차원이 축소된 데이터 이용 (계산 시간 줄이기 위하여) ⇒ batch effect 가 제거된 결과는 차원이 축..
Introduction to single-cell RNA-seq Human tissue 에는 엄청나게 다양한 cell types, states, interactions들이 있다. 해당 tissues와 celltypes을 좀 더 자세히 이해하기 위해 single cell RNAseq를 이용할 수 있고 이를 이용해 individual cells에서의 gene express를 확인 할 수있다. 사용예시 하나의 tissue 에 존재하는 cell types 알아낼 수있다. 알려지지 않거나 드문 cell types / states를 알아낼 수 있다. Differentiation process 나 시간/state 의 흐름에 따른 gene expression 변화를 알 수 있다. condition 에 따른 특정 cel..
NGS 데이터는 sequencer 에 의해서 생성되는 sequencing 파일 (fastq)를 시작으로 모든 분석이 이루어지면서 특정 성격을 띈다. NGS 세계에서 이용되는 많은 데이터 포맷 중, 가장 기본이 되는 파일들의 형식들을 중점으로 정리해보았다. * sequencers 예시: Illumina HiSeq 2500, Illumina NextSeq 500i, Illumina MiSeq,,, FASTQ : sequencing data with scores SAM : fastq파일을 aligning (mapping) 한 output 파일 (사람이 읽을 수 있는 버전) BAM : SAM 을 binary 한 파일로 사람이 읽을 수는 없지만, 용량을 줄일 수 있다. VCF : (Variant Calling F..