K-Nearest Neighbor1 차원의 저주 KNN으로 쉽게 이해하기 차원의 저주(Curse of Dimensionality) 간단히 말해, 데이터의 특징(feature)이 너무나도 많아서 알고리즘 성능 저하가 나타나는 현상을 일컫는다. 데이터를 학습시키는 근본적인 이유는 데이터 간의 경향성이나 어떤 패턴을 찾아 새로운 데이터에 대해서도 발견한 패턴을 적용하여 예측하기 위함이다. 하지만 데이터 셋(data set)이 고차원 공간(high-dimensional spaces)을 가지고 있다면 데이터 간 거리가 멀어져 비슷한 특징을 가지는 패턴이나 클러스터를 찾기 더 어려워진다. K-최근접 이웃(KNN, K-Nearest Neighbor) 새로운 데이터를 예측하고자 할 때, 기존 데이터들 중 가장 특성이 비슷한(거리가 가까운) K개의 데이터의 평균으로 예측치를 내는 방법이다. .. 2020. 8. 24. 이전 1 다음