일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- drug muggers
- python matplotlib
- EdgeR
- matplotlib
- ChIPseq
- single cell analysis
- single cell
- drug development
- julia
- CUT&RUN
- scRNAseq analysis
- ngs
- javascript
- single cell rnaseq
- CUTandRUN
- MACS2
- CSS
- HTML
- pandas
- 싱글셀 분석
- github
- js
- 비타민 C
- PYTHON
- scRNAseq
- Bioinformatics
- Git
- DataFrame
- cellranger
- Batch effect
Archives
- Today
- Total
바이오 대표
[ Python ] 교차 검증 (Cross Validation) - sklearn.Kfold 본문
교차 검증 (Cross Validation)
Machine Learning 모델을 학습시킬때, Train / Test set 으로 나누어 학습 및 성능 확인을 하는데 이때 너무 하나의 Train set 에 초점을 맞춰 과적합 (Overfitting) 을 불러 일으킬 수 있다. 이를 방지하기 위해 교차 검증 (Cross Validation) 을 사용할 수 있다. 이는 Train set 를 바꿔가며 훈련시켜 평균을 내어 과적합을 막을 수 있다.
아래 그림은 가장 기본적인 K-fold Cross validation 방법을 그림으로 묘사하였다.
예시 )
# X & y 를 KFold(n_split = ) 를 이용하여 Train/Test set 로 나눠 보겠다
여기서 Train: [2 3 4 5 6 7] Test: [0 1] 은 X의 index 이다
X:
[[ 0 1] # x[0]
[ 2 3] # x[1]
[ 4 5] # x[2]
[ 6 7] # x[3]
[ 8 9] # x[4]
[10 11] # x[5]
[12 13] # x[6]
[14 15]] # x[7]
'Python > others' 카테고리의 다른 글
[py.click] click pakage로 python package 만들기 (0) | 2023.06.12 |
---|---|
[ Algorithm ] Recursion 재귀 Algorithm (0) | 2022.03.06 |
[ sys ] python 으로 object 의 메모리 크기 알아내기 - getsizeof( ) (0) | 2022.02.10 |