문학적 딥러닝 2024. 11. 25. 21:41

균등분포는 이산분포에도 존재하니, 연속 균등분포라고 부르는 것이 더 정확하다(feat. 통계의 본질)

 

연속분포의 특징은 해당 함수식이 확률을 의미하는 것이 아닌, 확률밀도를 나타내는 것이다. 따라서 연속 분포에서는 함수식이 확률밀도함수를 나타낸다. 

 

이 부분이 정말로 많이 헷갈렸다, 갑자기 뜬금없이 확률밀도라니, 그냥 특징만 설명을 하고, 어떻게 나왔는지, 그리고 이것이 딥러닝과 어떻게 연관이 있는것인지, 많이 헷갈렸지만, 이는 KDE(커널 밀도 함수)와 같은 응용에서 사용된다. 따라서 확률밀도함수 하나만 파는 것은 크게 의미가 없었다. 

 

 

확률밀도 함수는 면적이 곧 확률이라는 말을 많이 들었을 것이다. 애초에 왜 면적을 통해서 구해야 하는가...?라는 의문도 많이 들었고, 면적이 확률이면, 적분을 하는 것인데, 그렇다면 

 

"어떤 함수" ---(미분)---> "확률밀도함수" 라는 과정을 거친다는 것인데, 저 어떤 함수는 무엇인가?라는 의문이 들어, CDF라는 누적분포 함수를 미분해서 구하는 것이지만, 크게 의미는 없었다. 그저 외운다는 느낌으로 넘어가게 되었다. 

 

이전의 이산 분포에서는 모든 확률을 더하면 1이 나왔는데, 확률밀도에서는 적분의 범위가 모든 범위를 감싸고 있으면 값이 1이 나오는 것을 기억하면 된다. 

 

그리고 균등분포는 종류가 많지는 않고, 그보다 예시를 보는 것이 훨씬 중요하다, 어떻게 변수를 잡을 것인가에 따라 계산할 때 주의해야 하는것이 있고, 다양하게 활용을 할 수 있기 때문이다(딥러닝도 그중 하나일 뿐이다)

 

평균과 분산을 구하는 과정도 비교적 짧았다. 

https://www.youtube.com/watch?v=f07ZFvKhRXk&list=PLmljWRabIwWDCLjAMfTPigyTe-jtsLca1&index=44