바이오 대표

[ Cross-Validation ] 교차 검증 (K-fold, Leave One Out Cross-Validation) 본문

Master dissertion

[ Cross-Validation ] 교차 검증 (K-fold, Leave One Out Cross-Validation)

바이오 대표 2022. 2. 21. 10:06

 

교차 검정 Cross Validation 은 ML 모델에서 최적의 Parameters 혹은 algorithm 방법을 찾기위해 사용된다. 데이터셋을 Training Set/Testing Set 으로 나누어서 모델을 여러번 평가 한 후 평균을 내어 모델/Parameters을 결정한다.

*데이터의 양이 충분치 않은경우, 모델의 성능 측정의 통계적 신뢰도를 높이기 위해 대표적으로 사용된다.

 

K-fold Cross-Validation

즉 데이터를 K 개로 나누고 K-1로 학습하고 나머지 한개로 테스트 하는 경우이다

  • Trining Set : Test로 선택된 데이터를 제외한 모든(K-1) 데이터로 모델 학습 
  • Testing Set : 나머지 한개로 테스트

* 에러율 (Error Rate) : E = 1/K(sum(Ei)) 

 

예시) 10-Fold Cross Validation           = Training Set ,         = Testing Set 

                                                                                                                                                                                   
                                                                                                                                                                                   
                                                                                                                                                                                   
                                                                                                                                                                                   

                                                                                                                                                                                   

 

 

 

 

One Leave Out Cross-Validation

데이터가 N 개 있을때 N-1 로 학습하고 나머지 한개로 테스트 하는 경우이다