일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- single cell
- Bioinformatics
- HTML
- Git
- scRNAseq
- 비타민 C
- python matplotlib
- CSS
- pandas
- Batch effect
- 싱글셀 분석
- single cell analysis
- PYTHON
- DataFrame
- EdgeR
- CUT&RUN
- CUTandRUN
- github
- ChIPseq
- js
- drug development
- julia
- javascript
- cellranger
- MACS2
- drug muggers
- single cell rnaseq
- ngs
- matplotlib
- scRNAseq analysis
- Today
- Total
목록Bioinformatics (7)
바이오 대표
NGS 데이터는 sequencer 에 의해서 생성되는 sequencing 파일 (fastq)를 시작으로 모든 분석이 이루어지면서 특정 성격을 띈다. NGS 세계에서 이용되는 많은 데이터 포맷 중, 가장 기본이 되는 파일들의 형식들을 중점으로 정리해보았다. * sequencers 예시: Illumina HiSeq 2500, Illumina NextSeq 500i, Illumina MiSeq,,, FASTQ : sequencing data with scores SAM : fastq파일을 aligning (mapping) 한 output 파일 (사람이 읽을 수 있는 버전) BAM : SAM 을 binary 한 파일로 사람이 읽을 수는 없지만, 용량을 줄일 수 있다. VCF : (Variant Calling F..
"pre-trained Bidirectional Encoder Representations from Transformers model for DNA-language in genome" Feb 2021 Abstract (해당 논문은 가짜연구소에서 알게된 지인의 관심사로 인해 읽어보았다. sequencing 이후에 서열 해석을 위해 NLP를 사용하는 것이다.) Motivation: non-coding DNA 를 해독하는 것은 유전체 연구에서 주 문제중 하나이다. Gene regulatory code (유전자 조절 코드)는 gene 의 여러 방면으로 해석이 가능하고 (polysemy), 멀리 떨어진 유전자와도 연관성이 있어 (distant semantic relation ship) 같이 아주 복잡하다. 이런한..
" Genome-wide meta-analysis of insomnia prioritizes genes associated with metabolic and psychiatric pathways " 07 2022 Abstract Insomnia (불면증) 은 유전적이고, 꽤 일반적이지만 충분한 치료법이 없는 수면장애이다. 130만명을 대상으로 한 genome-wide association studies(전체 유전체 상관분석연구)에서 200개가 넘는 관련 loci(chromosome에서의 유전자 위치)들을 식별해 내었다. 이러한 polygenicity(다인자성)는 아직 더 많은 loci들이 발견되지 않았다는 것을 뜻한다. 현재 연구는 샘플 사이즈를 거짓 두 배 증가하였고 (593,724 samples & ..
" PacBio Sequencing and Its Applications " 요새 제일 핫한 long-read PacBio sequencing 에 관한 논문이다. Abstract Pacific Bioscience가 발명한 단일분자 (Single-molecule) 실시간 (real-time) sequencing 은 second-generationg sequencing 보다 더 긴 read lengths 를 제공함으로써, genomes, transcriptome* 그리고 epigenetics* research에서의 풀지 못한 문제들에 사용 된다. PacBio sequencing 을 이용한 de novo assmbiles는 현존하는 reference assemblies의 빈 부분을 채울 수 있고, struct..