전체 글 50

(연속분포-2)지수분포

어느덧 마지막 분포로 왔다(정규분포는 따로 정리할 생각이 없기 때문이다). 오블완 챌린지 덕분에 이렇게 짧은 시간에 이렇게 공부를 하고 정리를 하는 경험을 하게 되었다.  (1)소개 지수분포는 푸아송 분포에서 유도된 것이다.  푸아송 분포는 "어떤 사건이 단위 시간동안 평균 λ(람다)번 발생할 때, 그 사건이 발생하는 횟수 x를 변수로 하는 분포이다.  그렇다면 지수 분포는 다음과 같다.  단위 시간당 평균 발생횟수가 λ일 때(푸아송 분포를 알고 있을 때), 사건이 처음 발생할 때까지 걸리는 시간이 T 이하일 확률(여기서 T와 t는 모두 시간을 의미한다).  유도는 좀 길고 지저분하다 https://youtu.be/OywjNb4jmtc?feature=shared 그리고 유도 말고도 예시를 푸는 영상들도 ..

(연속분포-1)균등분포

균등분포는 이산분포에도 존재하니, 연속 균등분포라고 부르는 것이 더 정확하다(feat. 통계의 본질) 연속분포의 특징은 해당 함수식이 확률을 의미하는 것이 아닌, 확률밀도를 나타내는 것이다. 따라서 연속 분포에서는 함수식이 확률밀도함수를 나타낸다.  이 부분이 정말로 많이 헷갈렸다, 갑자기 뜬금없이 확률밀도라니, 그냥 특징만 설명을 하고, 어떻게 나왔는지, 그리고 이것이 딥러닝과 어떻게 연관이 있는것인지, 많이 헷갈렸지만, 이는 KDE(커널 밀도 함수)와 같은 응용에서 사용된다. 따라서 확률밀도함수 하나만 파는 것은 크게 의미가 없었다.   확률밀도 함수는 면적이 곧 확률이라는 말을 많이 들었을 것이다. 애초에 왜 면적을 통해서 구해야 하는가...?라는 의문도 많이 들었고, 면적이 확률이면, 적분을 하는..

(이산확률-7)다항분포

다항분포는 이항분포에서 약간의 변형만 준 상황을 의미한다.  우선 이항분포에 대해 복습을 하자면, 이항분포는 "사건의 결과가 2가지로 나뉘는 경우"(발생과 미발생)를 의미한다. 즉, 결과가 2가지로 나뉘기에 "이항"분포인데, "다항"분포는 결과가 여러가지로 나뉘는 것일 뿐이다. 다항분포는 사건의 결과가 3가지 이상을 의미한다. 다항분포의 특징은 모든 변수를 신경 써야 한다는 것이다.각 사건이 발생할 확률들을 다 더하면 1이 나오고, 각 사건이 발생할 확률 변수를 x로 둔다면, x의 합은 총 시행 횟수 n을 의미한다. 유도 과정은 다음과 같다.여기서 x_1은 사건 1이 발생한 횟수를 의미한다는 것을 헷갈리면 안된다, 이런 부분이 잘 헷갈리기 때문에 확률변수가 무엇을 의미하는지 잘 알아야 한다, 기초가 중요..