일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- PYTHON
- julia
- MACS2
- scRNAseq
- 비타민 C
- HTML
- CSS
- matplotlib
- pandas
- single cell rnaseq
- single cell analysis
- scRNAseq analysis
- single cell
- 싱글셀 분석
- CUTandRUN
- javascript
- Batch effect
- EdgeR
- python matplotlib
- DataFrame
- cellranger
- drug development
- ChIPseq
- github
- Bioinformatics
- ngs
- js
- Git
- drug muggers
- CUT&RUN
- Today
- Total
목록Bioinformatics (7)
바이오 대표
NGS 데이터는 sequencer 에 의해서 생성되는 sequencing 파일 (fastq)를 시작으로 모든 분석이 이루어지면서 특정 성격을 띈다. NGS 세계에서 이용되는 많은 데이터 포맷 중, 가장 기본이 되는 파일들의 형식들을 중점으로 정리해보았다. * sequencers 예시: Illumina HiSeq 2500, Illumina NextSeq 500i, Illumina MiSeq,,, FASTQ : sequencing data with scores SAM : fastq파일을 aligning (mapping) 한 output 파일 (사람이 읽을 수 있는 버전) BAM : SAM 을 binary 한 파일로 사람이 읽을 수는 없지만, 용량을 줄일 수 있다. VCF : (Variant Calling F..
"pre-trained Bidirectional Encoder Representations from Transformers model for DNA-language in genome" Feb 2021 Abstract (해당 논문은 가짜연구소에서 알게된 지인의 관심사로 인해 읽어보았다. sequencing 이후에 서열 해석을 위해 NLP를 사용하는 것이다.) Motivation: non-coding DNA 를 해독하는 것은 유전체 연구에서 주 문제중 하나이다. Gene regulatory code (유전자 조절 코드)는 gene 의 여러 방면으로 해석이 가능하고 (polysemy), 멀리 떨어진 유전자와도 연관성이 있어 (distant semantic relation ship) 같이 아주 복잡하다. 이런한..
" Genome-wide meta-analysis of insomnia prioritizes genes associated with metabolic and psychiatric pathways " 07 2022 Abstract Insomnia (불면증) 은 유전적이고, 꽤 일반적이지만 충분한 치료법이 없는 수면장애이다. 130만명을 대상으로 한 genome-wide association studies(전체 유전체 상관분석연구)에서 200개가 넘는 관련 loci(chromosome에서의 유전자 위치)들을 식별해 내었다. 이러한 polygenicity(다인자성)는 아직 더 많은 loci들이 발견되지 않았다는 것을 뜻한다. 현재 연구는 샘플 사이즈를 거짓 두 배 증가하였고 (593,724 samples & ..
" PacBio Sequencing and Its Applications " 요새 제일 핫한 long-read PacBio sequencing 에 관한 논문이다. Abstract Pacific Bioscience가 발명한 단일분자 (Single-molecule) 실시간 (real-time) sequencing 은 second-generationg sequencing 보다 더 긴 read lengths 를 제공함으로써, genomes, transcriptome* 그리고 epigenetics* research에서의 풀지 못한 문제들에 사용 된다. PacBio sequencing 을 이용한 de novo assmbiles는 현존하는 reference assemblies의 빈 부분을 채울 수 있고, struct..