본문 바로가기

IT/통계7

로지스틱 회귀 분석 예시로 쉽게 이해하기 제품이 양품과 불량품이라는 두 가지 경우의 수를 가진 것처럼 로지스틱 회귀 분석은 종속변수가 이 분형일 때 사용된다. 이 종속변수는 하나 이상의 독립변수와 관계가 있다는 가정하에 회귀모형을 만들어 사용하게 된다. 이러한 특징을 가진 로지스틱 회귀 공식을 이해하기 위해 다음 내용들을 하나씩 알아가 보자. 이항 분포의 가능도 함수(Likelihood function) 어떤 제품이 양품일 확률이 50%인 경우, 10개 생산하여 양품이 8개 나올 확률은 이항 분포에 따라 다음과 같이 계산된다. 이는 양품이 나올 확률을 알고 있기 때문에 도출이 가능하다. $\left(\begin{array}{c}n\\ x\end{array}\right) \theta^x(1-\theta)^{n-x} = \left(\begin{ar.. 2020. 9. 30.
선형 회귀 분석 예시로 쉽게 이해하기 선형 회귀분석은 어떤 인자 X와 인자 Y의 관계를 예측하기 위해 사용된다. 예를 들어 광고비 X와 판매 수익 Y에 대한 데이터를 사용하여 선형 회귀모형을 만들었다면 추후 광고비 $x$금액을 투자하였을 때 기대되는 판매 수익 $\hat{y}$을 예측할 수 있다. 하지만 이는 상관관계를 설명할 뿐이지 인과관계를 설명하지는 못한다는 점에서 주의해야 한다. 즉 TV광고비를 늘렸기 때문에 판매 수익이 증가하였는지 또는 판매수익이 늘어남에 따라 회사에서 TV광고비에 투자를 많이 하였는지 무엇이 원인인지는 설명하지 못한다. 단순 선형 회귀모형 독립변수 X와 종속변수 Y에 대하여 다음 관계식이 성립한다고 가정한다. $Y = \alpha + \beta X + \varepsilon$ 여기서 오차 $\varepsilon$는.. 2020. 9. 30.
귀무가설 대립가설 개념 쉽게 이해하기 가설검정은 모집단에 대해 알려진 정보(귀무가설)에 대해 나의 표본을 통해 정보가 맞지 않다고 주장(대립 가설) 하기 위한 방법이다. 이를 쉽게 이해하기 위해 다음 내용들을 하나씩 살펴보자. 귀무가설 대립가설 정의 귀무가설은 모집단에 대해 사실이라고 알려진 특성치에 대한 정보이다. 예를 들어 ‘1번 버스의 배차간격은 평균 10분이다.’라는 안내문구가 귀무가설이 될 수 있다. 대립가설은 모집단으로부터 추출된 표본자료를 통해 귀무가설과 대치됨을 입증하고자 하는 가설을 의미한다. 예를 들어 하루 동안 1번 버스의 배차 간격을 측정한 나의 표본에 의해 ‘1번 버스의 배차 간격은 평균 10분보다 크다.’가 대립 가설이 될 수 있다. 가설검정은 무죄추정의 원칙에 빗대어 생각해볼 수 있다. 유죄라는 강력한 증거가 나오.. 2020. 9. 24.
95% 신뢰구간 공식 쉽게 이해하기 모집단이 정규분포 일 때, 모평균 $\mu$에 관한 95% 신뢰구간 공식은 다음과 같다. ($z_{0.025} = 1.96$) $P[\bar{X}-z_{0.025}\frac{\sigma}{\sqrt{n}}\leq\mu\leq\bar{X}+z_{0.025}\frac{\sigma}{\sqrt{n}}]=1-\alpha$ 위 식을 도출하기 위해 다음 내용들을 이해할 필요가 있다. 참고로, 수식을 넣으면 바로 설명과 함께 답을 도출해주는 재미있는 사이트가 있다. 흥미가 있다면 여러 문제를 넣어 사용해보는 것이 도움이 된다. 수식을 넣으면 풀이와 함께 답을 내주는 WolframAlpha 사용해보기 >> 모집단(Population)과 표본(Sample) 구분하기 ‘모집단’이란 통계적인 관찰의 대상이 되는 집단 전체를.. 2020. 9. 24.