일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 중앙갑
- 구현
- 알고리즘
- 그리디
- DP
- ML
- Machine learning
- 7569번
- p-value
- 큐
- 정렬
- Deeplearning
- Stack
- classification
- BFS
- 통계
- Python
- 자료구조
- Journal Review
- cs231n
- anomaly detection
- 스택
- 백준
- Queue
- datascience
- Anti Cheat
- Game Data Analysis
- 딥러닝
- AA test
- c++
- Today
- Total
Software Hyena::
여러가지 분포들 본문
Question
베르누이 분포 / 이항 분포 / 카테고리 분포 / 다항 분포 / 가우시안 정규 분포 / T 분포 / 카이제곱 분포 / F 분포 / 베타 분포 / 감마 분포 / 디리클레 분포에 대해 설명해주세요. 혹시 연관된 분포가 있다면 연관 관계를 설명해주세요.
베르누이 분포
- 먼저 베르누이 시행(Bernoulli Trial)이라는 것은 성공과 실패 두가지 결과만이 존재하는 시행으로서, 각 시행은 서로 독립 인 것을 말한다.
- 성공률이 p인 실험에서 성공이면 X = 1, 실패이면 X = 0이라 할 때
위 식을 만족하는 확률변수 X가 따르는 확률분포를 의미하며, 이항분포의 특수한 사례에 속한다.
이항 분포
- 성공률이 p인 베르누이 시행을 n번 반복시행할 때 성공횟수를 나타내는 확률변수 K의 분포를 이항분포라고 한다.
카테고리 분포
- 카테고리 시행(Categorical trial)은 k개의 카테고리 중 하나를 선택하는 실험을 말한다. 예를들어 주사위를 던지는 행위는 인 카테고리 시행으로 볼 수 있다.
- 베르누이 시행은 인 카테고리 시행으로 볼 수 있다.
- k개의 카테고리 중 하나가 나타날 확률을 나타내는 분포이다.
다항 분포
- 다항 분포는 여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각각의 값이 특정 횟수가 나타날 확률을 정의한다.
- 다항 분포에서 차원이 2인 경우 이항 분포가 된다.
- 어떤 시행에서 k 가지의 값이 나타날 수 있고, 그 값이 나타날 수 있는 확률을 p1, p2, p3 ... 이라고 할 때 n번의 시행에서 i번째 값이 xi회 나타날 확률은
다음과 같이 정의된다.
가우시안 정규 분포
- 정규분포(normal distribution) 과 같은 말이다.
- 자연 현상에서 나타나는 숫자를 확률 모형으로 나타낼 때 사용한다. 즉, 수집된 자료의 분포를 근사하는 데에 자주 사용된다.
- 확률 밀도 함수로 나타냈을 때, 엎어진 종모양 (bell shape)을 가진다.
- 정규분포는 2개의 매개 변수 평균 mu와 표준편차 sigma에 대해 모양이 결정되고, 이때의 분포를 N(mu,sigma^2) 로 표기한다.
- 평균이 0이고 표준편차가 1인 분포를 N(0,1), 표준정규분포( standard normal distribution ) 이라고 한다.
T 분포
- t-distribution는 표본의 크기가 충분하지 않고(n < 30) 모집단의 분산을 알기 어려울 때 정규분포의 평균을 측정할 때 주로 사용되는 분포이다.
- T 분포의 경우 검정방식에 초점을 두고 있는 분포이므로 T-검정 내용을 참고하는 것이 이해에 큰 도움이 될 것이라 생각한다.
[통계교육] 풀어쓰는 통계 - t 검정(t-test)이란?
1. t 검정을 비롯한 관련 용어 설명 2. t 검정의 특징 t검정의 특징을 정리하자면 다음과 같다. 3. t...
blog.naver.com
카이제곱 분포
- 카이제곱분포는 k개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포다. 이 때 k를 자유도라고 하며, 카이제곱 분포의 매개변수가 된다.
- 카이제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장하며, 오차나 편차를 분석할 때 도움을 받을 수 있는 분포이다.
- 양의 정수 k에 대해 독립적인 표준정규분포를 따르는 확률변수 X1, X2, ..., Xk를 정의하면 자유도 k 의 카이제곱분포는 확률변수
의 분포이다.
F 분포
- F분포는 정규분포를 이루는 모집단에서 독립적으로 추출한 표본들의 분산비율이 나타내는 연속 확률 분포이다.
- 두 가지 이상의 표본집단의 분산을 비교할 때, 모집단의 분산을 추정할 떄 사용된다. F test, ANOVA 분석등.
- 두 확률변수 V1,V2가 각각 자유도가 k1,k2이고 서로 독립인 카이제곱 분포를 따른다고 할 때, 다음과 같이 정의되는 확률변수 F는 자유도가 k1,k2인 F-분포를 따른다고 한다.
베타 분포
- 두 메개변수 알파와 베타에 따라 [0,1] 구간에서 정의되는 연속 확률 분포들의 모임이다.
- 베르누이와 이항 분포에서는 성공의 횟수가 확률변수인데, 베타분포에서는 성공의 비율이 확률변수이다. ex) 야구에서 타자의 타율
- 베타분포도 아래의 링크를 참조
확률분포(6): 베타분포
베르누이분포나 이항분포처럼 성공과 실패의 이항 선택을 다루는 확률분포로 베타분포(Beta distribution)가 있다. 베르누이와 이항 분포에서는 성공의 횟수가 확률변수인데, 베타분포에서는 성공
piramvill2.org
감마 분포
- 감마 분포는 연속 확률분포로, 두 개의 매개변수를 받으며 양의 실수를 가질 수 있다. 감마분포도 정규분포로 설명할 수 없는 부분을 보완하고자 나온 확률 분포이다.
- 감마 분포의 확률 밀도 함수는 감마 함수를 써서 나타낼 수 있다.
[확률과 통계] 40. 연속확률분포(4) - 감마 분포, Gamma Distribution
정규분포는 분명 통계학에서 다루는 가장 중요한 확률분포입니다. 하지만 정규분포가 아무리 우리가 ...
blog.naver.com
디리클레 분포
- 디리클레 분포(Dirichlet distribution)는 연속 확률분포의 하나로, k차원의 실수 벡터 중 벡터의 요소가 양수이며 모든 요소를 더한 값이 1인 경우 (이를 k-1차원 단체라고 한다)에 대해 확률값이 정의되는 분포이다.
- 2 이상의 자연수 k와 양의 상수 a1, ..., ak에 대하여, 디리클레 분포의 확률밀도함수는 실수값 x1, .., xk가 모두 양의 실수이며 실수값의 합이 1 임을 만족할 때
다음의 값을 가지며, 그 외는 0의 값을 가진다.
- 디리클레 분포에서 k=2인 경우 베타 분포가 된다.
ref
'수학 > 통계' 카테고리의 다른 글
공분산과 상관계수 (0) | 2023.02.01 |
---|---|
조건부 확률 (0) | 2023.01.29 |
누적 분포 함수와 확률 밀도 함수는 무엇일까요? (0) | 2023.01.22 |
확률변수와 확률모형 (0) | 2023.01.18 |
샘플링과 리샘플링 (0) | 2023.01.13 |