본문 바로가기

Resampling2

Bootstrap sampling (Bootstrapping, 부트스트랩 샘플링) 쉽게 이해하기 Bootstrap (부트스트랩)은 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나이다. 다른 resampling 방법인 K-Fold Cross Validation은 다음 글에서 자세히 확인할 수 있다. K-Fold Cross Validation (교차검증) 쉽게 이해하기 K-Fold Cross Validation (교차검증)은 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나이다. 그렇다면 교차검증을 사용하는 이유 및 방법을 알아보자. Cross Validation 사용하는 이유 modern-manual.tistory.com Bootstrap을 이해하기 전에, 장화의 손잡이 부분을 의미하는 bootstrap이라는 단어가 왜 사용되었는지 그 기원이 재미있.. 2020. 11. 3.
K-Fold Cross Validation(교차검증) 쉽게 이해하기 K-Fold Cross Validation (교차검증)은 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나이다. 그렇다면 교차검증을 사용하는 이유 및 방법을 알아보자. Cross Validation 사용하는 이유 머신러닝을 하기 위해 데이터를 Training set, Validation set, Test set으로 나누어 사용하는데 이 중 Training set으로 모델을 만든 뒤 Validation set으로 해당 모델의 성능을 평가하게 된다. 이때 샘플 수가 충분치 못한 경우 우연히 데이터를 어떻게 나누었는지에 따라 성능 차이가 많이 날 수 있다. 왼쪽 그림을 살펴 보면 랜덤으로 데이터를 한번 나눈 뒤 validation의 MSE(Mean Squared Error, 오차)를 .. 2020. 10. 19.