일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- drug development
- ngs
- DataFrame
- drug muggers
- js
- CSS
- Bioinformatics
- PYTHON
- MACS2
- scRNAseq analysis
- 싱글셀 분석
- CUTandRUN
- pandas
- github
- CUT&RUN
- cellranger
- ChIPseq
- single cell
- julia
- EdgeR
- single cell analysis
- single cell rnaseq
- scRNAseq
- python matplotlib
- Git
- Batch effect
- 비타민 C
- javascript
- HTML
- matplotlib
- Today
- Total
목록Cross validation (2)
바이오 대표
교차 검정 Cross Validation 은 ML 모델에서 최적의 Parameters 혹은 algorithm 방법을 찾기위해 사용된다. 데이터셋을 Training Set/Testing Set 으로 나누어서 모델을 여러번 평가 한 후 평균을 내어 모델/Parameters을 결정한다. *데이터의 양이 충분치 않은경우, 모델의 성능 측정의 통계적 신뢰도를 높이기 위해 대표적으로 사용된다. K-fold Cross-Validation 즉 데이터를 K 개로 나누고 K-1로 학습하고 나머지 한개로 테스트 하는 경우이다 Trining Set : Test로 선택된 데이터를 제외한 모든(K-1) 데이터로 모델 학습 Testing Set : 나머지 한개로 테스트 * 에러율 (Error Rate) : E = 1/K(sum(E..
교차 검증 (Cross Validation) Machine Learning 모델을 학습시킬때, Train / Test set 으로 나누어 학습 및 성능 확인을 하는데 이때 너무 하나의 Train set 에 초점을 맞춰 과적합 (Overfitting) 을 불러 일으킬 수 있다. 이를 방지하기 위해 교차 검증 (Cross Validation) 을 사용할 수 있다. 이는 Train set 를 바꿔가며 훈련시켜 평균을 내어 과적합을 막을 수 있다. 아래 그림은 가장 기본적인 K-fold Cross validation 방법을 그림으로 묘사하였다. 예시 ) # X & y 를 KFold(n_split = ) 를 이용하여 Train/Test set 로 나눠 보겠다 여기서 Train: [2 3 4 5 6 7] Test:..