딥러닝을 공부하면, 통계는 필수라고 할 수 있다. 당연히 실제로 통계학과에서 배우는 통계보다는 그 양이 적기는 하지만, 그럼에도 통계는 헷갈린다.
확률 분포의 정의: 확률 변수가 특정한 값을 가질 확률을 나타내는 "함수"
일단 확률 분포는 "함수"를 의미한다. 딥러닝에서 "확률 분포"를 나타낸다 라고 하는 말만 들으면, 전체적으로 n개 데이터중, 각 데이터가 나올 확률의 나열 이라고 착각을 했었다. 하지만 그냥 단순 나열과는 다르게, 함수라고 보면, 어떠한 식으로 정의가 된다는 것을 의미한다. p(X)
확률 변수의 정의: 어떠한 사건이 발생한다는 것을 특정 숫자로 바꾸는 것을 의미한다(이것도 변환 과정이 있는 "함수"이다).
어떻게 보면, 숫자의 크기에 의미를 두는게 아니라, 그냥 수 자체가 무엇을 의미하는 것만 중요하다.
통계가 어렵다고 하면, 항상 사람들은 "기초"를 보라고 한다, 용어를 헷갈린 것이다 등등 거의 맨날 기초 책만 추천한다. 나도 그런줄 알고 기초 책만 주구장창 봤던 것 같지만, 결론은 기초 통계가 아니라 수리통계학을 봐야 했다.
여기서 다양한 확률 분포의 종류가 무엇이 있고, 어떠한 상황에서 쓰이는지, 그리고 어떻게 정의 되는것인지. 이런 것들을 숙달 하는 과정을 거쳐야 확률 분포를 자연스럽게 받아들일 수 있었다.
그리고 추천하는 영상은 "통계의 본질 EOStatistics"이다
https://www.youtube.com/playlist?list=PLmljWRabIwWDCLjAMfTPigyTe-jtsLca1
확률분포 강의 (손으로 푸는 확률분포)
www.youtube.com
'(딥러닝을 위한)확률과 통계 > (딥러닝을 위한)확률 통계' 카테고리의 다른 글
시그모이드는 왜 애용할까?(나만의 정의) (0) | 2024.11.07 |
---|