본문 바로가기

IT27

의사결정트리 배깅(Bagging)과 랜덤포레스트(Random Forest) 쉽게 이해하기 Bagging과 random forests는 의사결정 트리(decision tree)를 발전시켜 더 좋은 예측 모델을 만들기 위해 사용되는 기법이다. 배깅(Bagging) Bootstrap aggregation을 줄여 bagging이라고 부른다. Bootstrap으로 생성된 sample data sets 각각으로 모델을 만든 뒤 모델의 평균값으로 예측을 하는 방법이다. 자세한 부트스트랩 개념은 다음 페이지를 참고하면 된다. Bootstrap sampling (Bootstrapping, 부트스트랩 샘플링) 쉽게 이해하기 Bootstrap (부트스트랩)은 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나이다. 다른 resampling 방법인 K-Fold Cross Validation.. 2020. 11. 3.
Bootstrap sampling (Bootstrapping, 부트스트랩 샘플링) 쉽게 이해하기 Bootstrap (부트스트랩)은 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나이다. 다른 resampling 방법인 K-Fold Cross Validation은 다음 글에서 자세히 확인할 수 있다. K-Fold Cross Validation (교차검증) 쉽게 이해하기 K-Fold Cross Validation (교차검증)은 데이터 내에서 반복적으로 샘플을 사용하는 resampling 방법 중 하나이다. 그렇다면 교차검증을 사용하는 이유 및 방법을 알아보자. Cross Validation 사용하는 이유 modern-manual.tistory.com Bootstrap을 이해하기 전에, 장화의 손잡이 부분을 의미하는 bootstrap이라는 단어가 왜 사용되었는지 그 기원이 재미있.. 2020. 11. 3.
의사결정트리(Decision Tree) 분류트리, Gini, Entropy 쉽게 이해하기 결정 트리 학습법(decision tree learning)은 머신러닝 학습 방법 중, 결과 데이터(output variable)로 학습시키는 지도 학습(supervised learning)에 해당된다. Output variable값이 연속적인 값일 경우(월급, 몸무게, 넓이 등) 회귀(regression)를 사용하며, output variable이 카테고리에 해당한다면(성별, 국적, 직급 등) 분류(classification)를 사용한다. 여기서는 분류 트리 (Classification tree)를 설명하고자 한다. 분류 트리 개념 분류트리는 분기로 나눈 구역의 most commonly occurring class (가장 많이 발생한 class) 비율이 높도록 하여 error rate을 낮추는 것을 목.. 2020. 11. 3.
의사결정트리(Decision Tree) 회귀트리, pruning 쉽게 이해하기 결정 트리 학습법(decision tree learning)은 머신러닝 학습 방법 중, 결과 데이터(output variable)로 학습시키는 지도 학습(supervised learning)에 해당된다. Output variable 이 연속적인 값일 경우(월급, 몸무게, 넓이 등) 회귀(regression)를 사용하며, output variable이 카테고리에 해당한다면(성별, 국적, 직급 등) 분류(classification)를 사용한다. 여기서는 회귀 트리 (Regression tree)를 설명하고자 한다. 회귀 트리 개념 회귀 트리는 RSS(오차 제곱합)를 가장 잘 줄일 수 있는 변수(predictor)를 기준으로 분기(split)를 만들어 결과를 예측하는 매우 단순한 모델이다. 어떤 변수가 중요한.. 2020. 11. 3.