(딥러닝을 위한)확률과 통계/다양한 확률 분포

(이산확률-7)다항분포

문학적 딥러닝 2024. 11. 24. 20:49

다항분포는 이항분포에서 약간의 변형만 준 상황을 의미한다. 

 

우선 이항분포에 대해 복습을 하자면, 이항분포는 "사건의 결과가 2가지로 나뉘는 경우"(발생과 미발생)를 의미한다. 즉, 결과가 2가지로 나뉘기에 "이항"분포인데, "다항"분포는 결과가 여러가지로 나뉘는 것일 뿐이다.

 

다항분포는 사건의 결과가 3가지 이상을 의미한다. 다항분포의 특징은 모든 변수를 신경 써야 한다는 것이다.

각 사건이 발생할 확률들을 다 더하면 1이 나오고, 각 사건이 발생할 확률 변수를 x로 둔다면, x의 합은 총 시행 횟수 n을 의미한다.

 

유도 과정은 다음과 같다.

여기서 x_1은 사건 1이 발생한 횟수를 의미한다는 것을 헷갈리면 안된다, 이런 부분이 잘 헷갈리기 때문에 확률변수가 무엇을 의미하는지 잘 알아야 한다, 기초가 중요하다는 말이 자주 나오는 이유이다.

 

다항분포의 평균과 분산은 다른 분포들과는 조금 다르다. 

 

다항분포의 평균과 분산은 어떤 확률변수를 중점으로 둘 것인지에 따라 평균과 분산이 여러개로 나뉜다는 것이다. 

 

다항분포의 평균과 분산은 사건 1개를 중점으로 이항분포를 바라보듯이 본다.

 

위에 있는 것처럼, 어떤 사건의 발생을 기준으로 바라보는지에 따라, 평균과 분산이 제각각 이라는 것을 얻을 수 있다. 

 

https://youtu.be/XMSojB6Qk-4?feature=shared