Software Hyena::

여러가지 분포들 본문

수학/통계

여러가지 분포들

bluehyena 2023. 1. 26. 17:14
반응형

Question

베르누이 분포 / 이항 분포 / 카테고리 분포 / 다항 분포 / 가우시안 정규 분포 / T 분포 / 카이제곱 분포 / F 분포 / 베타 분포 / 감마 분포 / 디리클레 분포에 대해 설명해주세요. 혹시 연관된 분포가 있다면 연관 관계를 설명해주세요.

 

베르누이 분포

- 먼저 베르누이 시행(Bernoulli Trial)이라는 것은 성공과 실패 두가지 결과만이 존재하는 시행으로서, 각 시행은 서로 독립 인 것을 말한다.

- 성공률이 p인 실험에서 성공이면 X = 1, 실패이면 X = 0이라 할 때

베르누이 분포(Bernoulli Distribution)

위 식을 만족하는 확률변수 X가 따르는 확률분포를 의미하며, 이항분포의 특수한 사례에 속한다.

 

이항 분포

- 성공률이 p인 베르누이 시행을 n번 반복시행할 때 성공횟수를 나타내는 확률변수 K의 분포를 이항분포라고 한다.

이항 분포

카테고리 분포

- 카테고리 시행(Categorical trial) k개의 카테고리 중 하나를 선택하는 실험을 말한다. 예를들어 주사위를 던지는 행위는 인 카테고리 시행으로 볼 수 있다.

- 베르누이 시행은 인 카테고리 시행으로 볼 수 있다.

- k개의 카테고리 중 하나가 나타날 확률을 나타내는 분포이다.

 

다항 분포

- 다항 분포는 여러 개의 값을 가질 수 있는 독립 확률변수들에 대한 확률분포로, 여러 번의 독립적 시행에서 각각의 값이 특정 횟수가 나타날 확률을 정의한다.

- 다항 분포에서 차원이 2인 경우 이항 분포가 된다.

-  어떤 시행에서 k 가지의 값이 나타날 수 있고, 그 값이 나타날 수 있는 확률을 p1, p2, p3 ... 이라고 할 때 n번의 시행에서 i번째 값이 xi회 나타날 확률은

다항 분포

다음과 같이 정의된다.

 

가우시안 정규 분포

-  정규분포(normal distribution) 과 같은 말이다.

 자연 현상에서 나타나는 숫자를 확률 모형으로 나타낼 때 사용한다. 즉, 수집된 자료의 분포를 근사하는 데에 자주 사용된다.

- 확률 밀도 함수로 나타냈을 때, 엎어진 종모양 (bell shape)을 가진다.

- 정규분포는 2개의 매개 변수 평균 mu와 표준편차 sigma에 대해 모양이 결정되고, 이때의 분포를 N(mu,sigma^2) 로 표기한다. 

- 평균이 0이고 표준편차가 1인 분포를 N(0,1), 표준정규분포( standard normal distribution ) 이라고 한다.

 

T 분포

- t-distribution 표본의 크기가 충분하지 않고(n < 30) 모집단의 분산을 알기 어려울 때 정규분포의 평균을 측정할 때 주로 사용되는 분포이다.

- T 분포의 경우 검정방식에 초점을 두고 있는 분포이므로 T-검정 내용을 참고하는 것이 이해에 큰 도움이 될 것이라 생각한다.

 

[통계교육] 풀어쓰는 통계 - t 검정(t-test)이란?

1. t 검정을 비롯한 관련 용어 설명  2. t 검정의 특징 t검정의 특징을 정리하자면 다음과 같다. 3. t...

blog.naver.com

 

카이제곱 분포

- 카이제곱분포는 k개의 서로 독립적인 표준정규 확률변수를 각각 제곱한 다음 합해서 얻어지는 분포다. 이 때 k를 자유도라고 하며, 카이제곱 분포의 매개변수가 된다.

- 카이제곱 분포는 신뢰구간이나 가설검정 등의 모델에서 자주 등장하며, 오차나 편차를 분석할 때 도움을 받을 수 있는 분포이다.

- 양의 정수 k에 대해 독립적인 표준정규분포를 따르는 확률변수 X1, X2, ..., Xk를 정의하면 자유도 k 의 카이제곱분포는 확률변수

카이제곱분포 (chi square distribution)

의 분포이다.

 

F 분포

- F분포는 정규분포를 이루는 모집단에서 독립적으로 추출한 표본들의 분산비율이 나타내는 연속 확률 분포이다.

- 두 가지 이상의 표본집단의 분산을 비교할 때, 모집단의 분산을 추정할 떄 사용된다. F test, ANOVA 분석등.

- 두 확률변수 V1,V2가 각각 자유도가 k1,k2이고 서로 독립인 카이제곱 분포를 따른다고 할 때, 다음과 같이 정의되는 확률변수 F는 자유도가 k1,k2인 F-분포를 따른다고 한다.

F분포 (F-distribution)

베타 분포

- 두 메개변수 알파와 베타에 따라 [0,1] 구간에서 정의되는 연속 확률 분포들의 모임이다.

- 베르누이와 이항 분포에서는 성공의 횟수가 확률변수인데, 베타분포에서는 성공의 비율이 확률변수이다. ex) 야구에서 타자의 타율

- 베타분포도 아래의 링크를 참조

 

확률분포(6): 베타분포

베르누이분포나 이항분포처럼 성공과 실패의 이항 선택을 다루는 확률분포로 베타분포(Beta distribution)가 있다. 베르누이와 이항 분포에서는 성공의 횟수가 확률변수인데, 베타분포에서는 성공

piramvill2.org

 

감마 분포

- 감마 분포는 연속 확률분포로, 두 개의 매개변수를 받으며 양의 실수를 가질 수 있다. 감마분포도 정규분포로 설명할 수 없는 부분을 보완하고자 나온 확률 분포이다.

- 감마 분포의 확률 밀도 함수는 감마 함수를 써서 나타낼 수 있다.

감마분포 (Gamma Distribution)

 

[확률과 통계] 40. 연속확률분포(4) - 감마 분포, Gamma Distribution

정규분포는 분명 통계학에서 다루는 가장 중요한 확률분포입니다. 하지만 정규분포가 아무리 우리가 ...

blog.naver.com

 

디리클레 분포

- 디리클레 분포(Dirichlet distribution)는 연속 확률분포의 하나로, k차원의 실수 벡터 중 벡터의 요소가 양수이며 모든 요소를 더한 값이 1인 경우 (이를 k-1차원 단체라고 한다)에 대해 확률값이 정의되는 분포이다.

- 2 이상의 자연수 k와 양의 상수 a1, ..., ak에 대하여, 디리클레 분포의 확률밀도함수는 실수값 x1, .., xk가 모두 양의 실수이며 실수값의 합이 1 임을 만족할 때

디리클레 분포 (Dirichlet distribution)

다음의 값을 가지며, 그 외는 0의 값을 가진다.

- 디리클레 분포에서 k=2인 경우 베타 분포가 된다.

 

ref

- https://mjshin.tistory.com/16

- https://supermemi.tistory.com/72

반응형

'수학 > 통계' 카테고리의 다른 글

공분산과 상관계수  (0) 2023.02.01
조건부 확률  (0) 2023.01.29
누적 분포 함수와 확률 밀도 함수는 무엇일까요?  (0) 2023.01.22
확률변수와 확률모형  (0) 2023.01.18
샘플링과 리샘플링  (0) 2023.01.13
Comments