Bayes rule
MLE와 MAP 를 공부하기에 앞서 베이즈 정리를 먼저 이해해야 한다
정의는 두 확률 변수의 사전 확률과 사후 확률 사이의 관계를 나타내는 정리이다
그리고 여러가지 용어가 있는데
-
Likelihood
단서가 어떤 식으로 분포되어 있는지 나타내는 것이다
흔히 사람들이 직감적으로 확률을 맞추는 것의 대부분이 이것에 해당된다
-
Prior
사전 지식을 의미하는 것으로 다양하게 가능하고
사전 지식이 없는 경우 없어도 가능하다
-
Posterior
Likelihood 와 Prior 둘다 반영 된 것이다
-
P (A|B)
B일때 A가 발생활 확률이다
예를 들어 P(A)가 오늘 술을 마실(A) 확률이라면
P(A|B)는 남자가(B) 오늘 술을 마실(A) 확률이 되는 것이다
다시 Bayes rule로 돌아와서 사례를 하나 만들어 보자
흡연율을 알고 싶어서 피시방에 가서 이용하는 사람들의 흡연 유무를 조사했다
그러자 50퍼센트가 나왔다
그렇다면 여자의 50퍼센트는 흡연을 한다고 할수 있을까
아니다 피시방을 사용하는 사람들의 80퍼센트이상은 남자이고
즉 여자의 흡연율을 50퍼센트라고 할수 없는것이다
50퍼센트가 나온것이 Likelihood라고 볼수 있고
피시방의 80퍼센트는 남자인 데이터는 Prior
이 둘을 조합해서 남녀의 흡연율을 알아낸것이
Posterior라고 할 수 있다
위의 수식이 Bayes rule이다
P(A|B) Posterior는 P(B|A) Likelihood에 P(A)
를 곱하고 P(B) Evidence로 나누어 준 것이다
여기서 evidence는 고정된 값이기 때문에 생략하고 계산하기도 한다
MLE
Bayes rule을 배웠으니 이제 MLE를 배울 차례다
또 예를 하나 들어보자
이번주 토요일에 붕어빵을 사러갔는데 문을 닫았다
아쉬워서 다음주 토요일에도 붕어빵을 사러갔는데 또 닫았다
그래서 마지막으로 그 다음주 토요일에도 가봤지만 열지 않았다
위의 사실을 바탕으로 대부분은 아 토요일에 붕어빵을 팔지 않는구나 라고 생각한다
사람들이 위와같이 직감적으로 판단을 하는것은
관찰한 사실이 가장 확률이 높은 경우라고 생각하는 것이다
3번 봤으니 항상 그러겠지라고 생각하지 아무도 아 하필 우연히 쉬는날마다 내가 골라 갔구나 라고 생각하지 않는 것이다
이것을 수학적으로 생각하면
실제 값은 내가 예측한 사실을 평균(m)으로 하고 특정 값 σ를 표준 편차로 하는 정규 분포를 따른다
즉 내가 관찰한 경우가 최대의 확률이 될때를 찾아주는 것이다
MAP
MLE가 Likelihood를 최대화 했다면
MAP는 Prior까지 계산된 Posterior를 최대화하는 것이다
크게 차이나는 것 없이 Prior만 같이 계산 해주면 된다
Prior를 적용하는 이유는 무엇일까
적절한 Prior를 적용할 경우 찾고자 하는 값을 찾는 과정에 큰 도움이 되기 때문이다
단순한 지식뿐만 아니라 Prior의 Scale을 조절하면서
Output의 크기 또한 조절이 가능한 것이다
MLE & MAP
사전지식이 없이 대상의 데이터만 가지고 예측하고싶다면
MLE을 사용하면 되고
데이터 + 사전지식 까지 사용하고 싶다면
MAP를 사용하면 되는 것이다