Published on

BA01. [The Short Shot] 수학해설

BA01. [The Short Shot] 수학해설

앞서 본 [Short Shot] 이야기는 단순한 소설이 아니다. 철저한 수학적 계산 위에 지어진 성과 같다. 교과서에서 배우는 '전통적 베이즈 정리'가 현장에서 쓰이는 '오즈와 베이즈 인자'로 어떻게 변환되는지, 그 수학적 청사진(Blueprint)을 공개한다.

1. 교과서의 방식 (The Probability View)

아래 방정식이 우리가 학교에서 배우는 베이즈 정리의 원형이다. 핵심은 분모를 통해 전체 확률의 합이 항상 1(100%)이 되도록 정규화(Normalization) 한다는 것이다.

이때 우도 P(D|H)—즉, 가설 H가 참일 때 해당 데이터가 관측될 확률—는 데이터의 성격에 따라 그 분포가 결정된다. 앞서 본 'Short Shot' 시나리오의 경우, 온도(H T )와 압력(H P )이라는 두 가지 가설 하에 '불량' 또는 '양품'이라는 결과만 존재한다. 이를 1과 0으로 치환하면, 개별 데이터는 전형적인 베르누이 확률분포(Bernoulli Distribution)를 따르게 된다.

P(HD)=P(DH)P(H)P(D)P(H|D) = \frac{P(D|H) P(H)}{P(D)}
  • P(H/D) : 사후확률(데이터를 본 뒤의 믿음, 신뢰도, 확률, 확률분포)

  • P(D/H) : 우도 (가설이 맞을 때 데이터가 나올 확률)

  • P(H) : 사전확률 (기존의 믿음)

  • P(D) : 증거의 확률 (모든 가설을 통합한 데이터 발생 확률)

** 현장의 계산 실무적 문제점

여기서 분모인 P(D)P(D)를 계산하는 게 골치 아프다. 모든 가설의 확률을 다 더해야 하기 때문이다. P(D)=P(DHT)P(HT)+P(DHP)P(HP)P(D) = P(D|H_T)P(H_T) + P(D|H_P)P(H_P) … (가설이 많아지면 계산이 폭발할 뿐 아니라, 실전에서 모르는 경우가 대부분이다)

2. 이야기 속의 방식: The Odds View

오즈(Odds) 계산법은 가설 검정형 베이지안 추론을 수행하는 또 다른 강력한 접근 방식이다. 이 방식의 핵심은 '주관적 확률(Subjective Probability)'을 적극적으로 활용한다는 점이다.

경영 현장의 관리자들은 저마다 다른 직관과 경험적 신념을 가지고 있다. 오즈 프레임워크는 이러한 개인의 주관을 배제하는 것이 아니라, 오히려 이를 체계적이고 일관성 있게 관리할 수 있는 도구로 전환해 준다. 관리자는 자신의 초기 신념을 오즈로 수치화하고, 새로운 증거(데이터)가 들어올 때마다 이를 반영하여 확률을 지속적으로 업데이트한다.

이 반복적인 과정을 통해 관리자는 자신의 직관이 실제 데이터와 얼마나 부합하는지 검증하며 의사결정의 품질을 높여갈 수 있다. 무엇보다 기술적인 관점에서, 발생 가능한 모든 데이터의 경우의 수를 고려해야 하는 '골치 아픈 분모 P(D)를 계산할 필요가 없다는 점은 실무적으로 큰 강점이다

[경영자를 위한 오즈(Odds) 프레임워크의 가치]

  • 주관의 체계화: 관리자마다 다른 직관과 신념(주관적 확률)을 일관된 수치로 관리하는 프레임워크 제공.

  • 동적 의사결정: "신념 설정 → 데이터 반영 → 신념 업데이트"의 반복 루프를 통해 의사결정의 정합성 검증.

  • 계산의 효율성: 오즈 방식을 사용함으로써, 전체 확률을 계산해야 하는 복잡한 분모 P(D) 연산을 제거하여 신속한 의사결정 지원.

Posterior Odds=Prior Odds×Bayes Factor\text{Posterior Odds} = \text{Prior Odds} \times \text{Bayes Factor}
  • Odds(오즈): 가설 A가 가설 B보다 몇 배 유력한가? (비율)

  • Bayes Factor(베이즈 인자): 데이터가 가설 A를 가설 B보다 몇 배 더 지지하는가? (힘의 비율)

3. 완벽한 일대일 대응 (The Mapping)

자, 이제 마법을 부려보자. 어떻게 '복잡한 확률 공식'이 '심플한 오즈 공식'으로 변신할까? 우리는 두 개의 가설, 온도(H T )와 압력(H P )을 가지고 있다. 아래 각각의 전통적 베이즈 식을 정리해 본다.

식 A (온도가 범인이라는 온도가설에 대한 식):

P(HTD)=P(DHT)P(HT)P(D)P(H_T|D) = \frac{P(D|H_T) P(H_T)}{P(D)}

식 B (압력이 법인이라는 압력가설에 대한 식):

P(HPD)=P(DHP)P(HP)P(D)P(H_P|D) = \frac{P(D|H_P) P(H_P)}{P(D)}

이제 [식 A]를 [식 B]로 나누어 본다. 그러면 놀라운 일이 벌어진다.

P(HTD)P(HPD)=P(DHT)P(HT)P(D)P(DHP)P(HP)P(D)\frac{P(H_T|D)}{P(H_P|D)} = \frac{\frac{P(D|H_T) P(H_T)}{P(D)}}{\frac{P(D|H_P) P(H_P)}{P(D)}}

분모와 분자에 똑같이 있는 골칫덩어리 P(D)가 약분되어 사라진다! (펑!)

남은 것들을 정리하면 바로 우리가 이야기에서 썼던 그 공식이 된다.

P(HTD)P(HPD)Posterior Odds=P(DHT)P(DHP)Bayes Factor×P(HT)P(HP)Prior Odds\underbrace{\frac{P(H_T|D)}{P(H_P|D)}}_{\text{Posterior Odds}} = \underbrace{\frac{P(D|H_T)}{P(D|H_P)}}_{\text{Bayes Factor}} \times \underbrace{\frac{P(H_T)}{P(H_P)}}_{\text{Prior Odds}}

** 핵심 포인트

  • 전통적 방식의 사후확률 비율 → Posterior Odds

  • 전통적 방식의 우도 비율 → Bayes Factor

  • 전통적 방식의 사전확률 비율 → Prior Odds

결국 오즈(Odds) 방식은 새로운 수학이 아니라, 복잡한 정규화 상수 P(D)를 제거하여 계산을 효율화한 베이즈 정리의 현장 버전이다.

4. 실제 데이터 대입 (검증)

이야기 속 '오전 데이터(50개 중 5개 불량)'를 양쪽 방식에 넣어 똑같은 결과가 나오는지 확인해 보자

A. 이야기 속 방식 (Odds & Bayes Factor)

  • Prior Odds: 0.6 / 0.4 = 1.5

  • Bayes Factor:

4.7\approx \mathbf{4.7}

(계산값)

  • Posterior Odds: 1.5 x 4.7 = 7.05

  • 최종 확률:

7.05/(1+7.05)87.6%7.05 / (1+7.05) \approx \mathbf{87.6\%}

B. 전통적 방식 (Probability)

  • 우도 계산(베르누이분포, P=불량률, k=불량수량, n=샘플수량): P k
  • (1-P) n-k
  • 온도 우도
P(DHT):(0.08)5(0.92)45아주 작은 수 AP(D|H_T): (0.08)^5(0.92)^{45} \approx \text{아주 작은 수 A}
  • 압력 우도
P(DHP):(0.04)5(0.96)45아주 작은 수 BP(D|H_P): (0.04)^5(0.96)^{45} \approx \text{아주 작은 수 B}
  • (여기서 A는 B의 약 4.7배이다. 직접 계산해 보라)

  • 증거 확률 P(D) 계산:

(A×0.6)+(B×0.4)(A \times 0.6) + (B \times 0.4)
  • 사후 확률 P(H T|D ):
A×0.6(A×0.6)+(B×0.4)\frac{A \times 0.6}{(A \times 0.6) + (B \times 0.4)}
  • 이 복잡한 식을 계산기로 두드리면? 놀랍게도 정확히
87.6%\mathbf{87.6\%}

가 나온다.

결론 (Writer's Conclusion)

우리는 왜 오즈(Odds) 방식을 쓸까?

전통적 방식은 매번 P(D)라는 전체 합계를 구해야 해서, 데이터가 계속 들어오는 스트리밍 상황(Loop)에서는 계산이 느려진다.

반면 오즈 방식은 단순 곱셈만 계속하면 된다.

이것이 바로 현장의 엔지니어와 AI가 베이즈를 사랑하는 이유이자, 이야기 속에서 오즈방식을 쓴 이유이다.

Bayesian EXAWin-Rate Forecaster

매 미팅과 협상에서 포착되는 미세한 신호를 베이지안 업데이트로 실시간 분석하여 영업 성공 확률을 정교하게 예측합니다. EXAWin과 함께라면 직관의 영역이었던 영업이 가장 완벽한 데이터 과학으로 진화합니다.

Comments0

Deep Dive

More in Bayesian

Explore Archive
BA024. EXAWin 베이지안 엔진의 진화: 데이터가 스스로 파라미터를 튜닝하는 날
Bayesian
Auto-Tuner
EXA Intel

BA024. EXAWin 베이지안 엔진의 진화: 데이터가 스스로 파라미터를 튜닝하는 날

EXA 베이지안 엔진은 수주 확률을 계산해 주었지만, 그 정밀도는 사람이 설정한 초기 파라미터에 달려 있었다. 100개의 과거 딜 데이터가 쌓였을 때, 엔진은 스스로 진화할 준비를 마쳤다. Grid Search, MCMC 앙상블 샘플링, 교차검증 — 세 개의 수학적 도구가 협업하여 최적의 파라미터를 찾아가는 과정을 소설로 그립니다.

ANALYSIS
BA025. 최적의 경계를 찾아서 — Grid Search와 Youden's J의 수학
Bayesian
Auto-Tuner
EXA Intel

BA025. 최적의 경계를 찾아서 — Grid Search와 Youden's J의 수학

3,240개의 파라미터 조합 중 어떻게 '최적'을 찾는가? Grid Search가 전수 탐색하고, Youden's J 지수가 민감도와 특이도의 균형점을 찾는 수학적 원리를 비즈니스 맥락과 함께 풀어낸다. 영업 단계 가중치(T)와 시그널 민감도(k)를 데이터가 스스로 조율하는 Auto-Tuner의 첫 번째 기둥.

ANALYSIS
BA026. 입자들의 합의 — MCMC 앙상블과 교차검증의 수학
Bayesian
Auto-Tuner
EXA Intel

BA026. 입자들의 합의 — MCMC 앙상블과 교차검증의 수학

Grid Search가 '최적의 언덕'을 찾았다면, MCMC 앙상블 샘플러는 '그 언덕의 높이가 맞다'고 256명의 탐험가가 합의하는 과정이다. Emcee의 아핀 불변 워커, R̂ 수렴 진단, HDI 95% 신뢰구간, 그리고 5-Fold 교차검증과 Signal Lift 분석의 수학적 원리를 비즈니스 맥락과 함께 풀어낸다.

ANALYSIS
BA01. [The Short Shot] 수학해설 | EXA Enterprise