일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- github
- Batch effect
- EdgeR
- CSS
- 싱글셀 분석
- ngs
- js
- julia
- DataFrame
- CUT&RUN
- HTML
- Git
- python matplotlib
- drug development
- Bioinformatics
- drug muggers
- 비타민 C
- single cell rnaseq
- cellranger
- PYTHON
- scRNAseq analysis
- pandas
- single cell analysis
- MACS2
- ChIPseq
- single cell
- javascript
- scRNAseq
- CUTandRUN
- matplotlib
- Today
- Total
목록Master dissertion (6)
바이오 대표
교차 검정 Cross Validation 은 ML 모델에서 최적의 Parameters 혹은 algorithm 방법을 찾기위해 사용된다. 데이터셋을 Training Set/Testing Set 으로 나누어서 모델을 여러번 평가 한 후 평균을 내어 모델/Parameters을 결정한다. *데이터의 양이 충분치 않은경우, 모델의 성능 측정의 통계적 신뢰도를 높이기 위해 대표적으로 사용된다. K-fold Cross-Validation 즉 데이터를 K 개로 나누고 K-1로 학습하고 나머지 한개로 테스트 하는 경우이다 Trining Set : Test로 선택된 데이터를 제외한 모든(K-1) 데이터로 모델 학습 Testing Set : 나머지 한개로 테스트 * 에러율 (Error Rate) : E = 1/K(sum(E..
" A Unified View of Relational Deep Learning for Drug Pair Scoring " 논문을 읽고 정리한 글이다. 해당 논문에서는 크게 아래와 같은 4가지 내용을 다룬다. drug-drug interaction, polypharmacy side effect, synergistic drug combination prediction tasks Formal Unification 해당 Tasks 를 위한 ML design, architecture overview Available Datasets과 자주 사용되는 evaluation metrics 해당 ML을 이용한 applications 과 미래 활용성에 대한 discussion Abstract 최근 ML 이용해서 알아내고 ..
Text Similarity 를 구하는 방법에는 String-based, Corpus(말뭉치)-based, Knowledge based가 있다 논문에서 Side Effect to Side Effect, Disease to Disease Similarity 를 위해 간단히 String-Based Text Similarity 를 적용하였다. String-Based Text Similarity: [1] Character-based [2] Term-based ( Cosine Similarity, Jaccard Similarity) Jaccard Similarity number of shared terms over the number of all unique terms in both strings Cosine S..
Leave-one-out CV(cross-validation) Two-step kernel regression 2. Supervised network prediction settings [1] bipartite networks [2] homogeneous networks Issue 1) Symmetric 생각해주기 ex) protein u 가 protein v 랑 interaction 이 있으면 protein v 와 protein u 도 interaction 2) FN or missing interactions (없애보고 모델이 recover하는지 확인 필요 by zero-one-out) 2.1 Cross-validation for bipartite network prediction (protein-li..