본문 바로가기

IT27

차원의 저주 KNN으로 쉽게 이해하기 차원의 저주(Curse of Dimensionality) 간단히 말해, 데이터의 특징(feature)이 너무나도 많아서 알고리즘 성능 저하가 나타나는 현상을 일컫는다. 데이터를 학습시키는 근본적인 이유는 데이터 간의 경향성이나 어떤 패턴을 찾아 새로운 데이터에 대해서도 발견한 패턴을 적용하여 예측하기 위함이다. 하지만 데이터 셋(data set)이 고차원 공간(high-dimensional spaces)을 가지고 있다면 데이터 간 거리가 멀어져 비슷한 특징을 가지는 패턴이나 클러스터를 찾기 더 어려워진다. K-최근접 이웃(KNN, K-Nearest Neighbor) 새로운 데이터를 예측하고자 할 때, 기존 데이터들 중 가장 특성이 비슷한(거리가 가까운) K개의 데이터의 평균으로 예측치를 내는 방법이다. .. 2020. 8. 24.
머신러닝 딥러닝 차이 쉽게 알아보기 딥러닝과 머신러닝의 관계 우선, 딥러닝은 머신러닝의 한 종류이다. 두 단어 모두 ‘자동으로 학습하는 알고리즘’을 뜻한다. 머신러닝은 딥러닝을 포함하는 개념이지만 최근 머신러닝이라는 말은 딥러닝을 제외한 나머지 머신러닝 기술들을 지칭하기 위해 사용되는 측면이 크다. 딥러닝과 머신러닝의 차이 머신러닝은 크게 다음과 같은 과정을 거치게 된다. 데이터 수집(Gathering Data) – 변수 가공(Feature Engineering) – 모델 학습(Train Model) – 모델 평가(Test Model) 전통적 프로그래밍(Traditional Programming)에서는 사람이 알고리즘을 직접 작성하였다면, 머신러닝을 통해서는 그럴 필요 없이 모델을 자동 생성할 수 있다. 머신러닝에서 한 발 더 나아가, 데.. 2020. 8. 20.
인공지능, 머신러닝 그리고 딥러닝의 뜻 알아보기 인공지능, AI(Artificial Intelligence) "AI는 기계를 지능적으로 만들기 위한 활동이며, 지능은 어떤 요소가 적절히 기능하며 그 환경에서 잘 예측하는 것을 말한다." “AI is that activity devoted to making machines intelligent, and intelligence is that quality that enables an entity to function appropriately and with foresight in its environment.” – Nils Nilsson ‘지능’이라는 개념을 정확히 설명하기 어렵듯이 ‘인공지능’도 그 뜻을 명확하게 설명하기 어려운 부분이 있다. 사람은 문을열고 나가는 작은 행동에서도 '지능'을 사용하는데,.. 2020. 8. 6.