오늘 나의 운세는?!! (Bayesian vs Frequentist 로 바라본 운세)


필자는 가끔 정말로 힘든날이면 하는게있다.
퇴근하는길에 다음운세에 들어가서 그날의 운세를 확인하는것이다…
그럼 보통은 정말 희한하게도 이런 운세들이 안내된다

나의 운세를 도대체 어떻게들 알고계시는지? 미리 알려준다면 좋을텐데..

그러면 운세를 확률의 관점으로 바라본다면 어떨까?
먼저 오늘의 운세를 확인하기 위해선 생년월일 그리고 태어난 시간, 양/음력, 성별 정보를 입력해야한다. 운세 자체는 과거에 살던 여러 사람들의 생년월일, 성별 등을 기준으로 정리해 만든 것이다. 실제로 토정비결은 사람의 생년월일, 즉 6자로 괘를 정해 모두 합해봐야 144가지에 불과하다. 우리나라 인구를 5천만명으로 잡으면 약 35만명에 가까운 사람이 해마다 같은 점괘를 갖는다는 이야기다 (50,000,000 / 144 = 347,222.2222222)

확률을 바라보는 방법 중에 빈도주의적(frequentist) 접근과 베이즈(bayesian)접근방식이 있다. 예를 들면 각자가 바라보는 세상은 이런 것이다.

The frequentist way

나는 오늘 나의 운세가 어떻게 나올지 모른다. 그러나 나는 그 값이 고정되어 있다는 것을 안다. (1 ~ 144번 운세) 모든 운세는 fair하고 따라서 144개의 경우들은 모두 같은 빈도로 발생할 것이다 (1/ 144)

The Bayesian way

44번 운세(주객전도)가 나올확률은 0과 1사이의 임의의 값이다.
나는 임의로 1/100라고 간주한다. (이 확률을 사전확률)
100 년동안 운세를 매일매일 봤더니 ( 100 * 365 + 25 = 36525)
240번 정도 같은 운세가 나왔다. (데이터)
이제 데이터가 있으므로 새로운 데이터를 이용해서 처음에 세운 사전확률을 수정해보자. 새로운확률(사후확률)은 240/ 36525 이다

빈도주의자들에게는 1/144이 참된 확률값이고 240/ 36525 는 참된 확률값의 추정치에 불과하다. 반면 베이지안들에게는 44번 운세(주객전도)가 나올 확률 자체가 확률분포를 가지고 있다고 생각한다. 확률값의 분포와 확률값의 추정치는 있지만 참된 확률값이란 없는 것이다.
이들은 데이터를 얻기전에 이미 자신이 생각한 사전확률분포가 있다. 그리고 데이터를 얻게되면 자신의 믿음을 계속해서 update 해 나가는 것이다. 베이지안들에게는 이런 수정과정을 거쳐서 믿음을 참된 분포에 근접시키는 것이 중요한 일이다

베이지안의 관점으로 모델을 만든다면 어떻게 운세를 예측할수있을까?

  1. 기존 생년월일, 성별 정보에 추가로 직업, 사는곳, 결혼여부 등의 데이터를 기반으로 평균적인 운세를 예측한다
  2. 평균운세를 기반으로 오늘의 운세를 안내해서
  3. 운세가 어느정도 일치하는지 사용자가 점수를 매기게 하는것이다
  4. 점수에 따라 안내하는 운세를 조금씩 update 해나간다

인류 전체의 운세를 이런 방식으로 매기게되면 좀 더 정확한
미래 나의 운세를 알수있는 날이 오게될까???