일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- AA test
- ML
- c++
- 알고리즘
- 자료구조
- 통계
- 정렬
- 스택
- Anti Cheat
- 백준
- 7569번
- Game Data Analysis
- Queue
- 그리디
- Python
- Journal Review
- 구현
- datascience
- BFS
- cs231n
- p-value
- 딥러닝
- DP
- 큐
- anomaly detection
- Machine learning
- Stack
- Deeplearning
- classification
- 중앙갑
- Today
- Total
목록통계 (7)
Software Hyena::

Question 신뢰 구간의 정의는 무엇인가요? 통계학에서 신뢰 구간(confidence interval)은 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법이다. 모수를 하나의 값으로 추정하기 보다는 구간으로 추정하는 것이 좀 더 좋은 방법이다. 모수를 추정하기 위하여 만든 구간을신뢰구간 이라고 하며 신뢰구간은 점추정치에 적당한 값을 빼고 더하여 만든다. 평균이 μ, 표준편차가 σ가 0 정규분포의 모집단에서 표본 n개를 뽑아 모평균을 추정할떄 표본 n개의 표본 평균 X_bar 의 분포는 N(μ,σ/√n)이므로 다음 등식이 성립한다. 단, 여기서 z_(α/2)는 Z가 표준정규분포를 따르는 확률변수일 때 다음 식을 만족하는 값이다. 따라서 다음 구간이 모평균 μ를 포함할 확률은 1−α 이다. α가 ..

Question. 공분산과 상관계수는 무엇일까요? 수식과 함께 표현해주세요 공분산 (Covariance) 공분산이란 2개의 확률변수의 상관관계의 정도를 나타내는 값이다. 공분산의 값이 양수라면, 두 확률변수는 양의 선형 관계가 있고, 공분산의 값이 음수라면 두 확률변수는 음의 선형관계가 있다. 또, 공분산은 아래와 같은 성질을 가진다. 같은 확률변수에 대한 공분산은 확률변수의 분산과 같으며, Cov(X,Y) = Cov(Y,X)로 동일하다. 또한, Cov(aX, bY)의 경우 ab Cov(X, Y)와 같다. 피어슨 상관계수에 사용되는 표본 공분산은 다음과 같다. 상관계수 (Correlation Coefficient) 상관계수는 두 변수 사이의 통계적 관계를 표현하기 위해 특정한 상관관계의 정도를 수치적으로..

Question 조건부 확률은 무엇일까요? 확률론에서 조건부 확률conditional probability)은 주어진 사건이 일어났을 때 다른 한 사건이 일어날 확률을 말한다. 원래의 확률 함수를 P라고 할 때 사건 A가 일어났다는 조건에서 사건 B가 일어날 조건부 확률은 P(B|A)로 표기한다. 예제 50명이 수강하는 과목 A 에서 안경을 쓴 학생의 비율이 70%, 3학년 학생의 비율이 35%, 안경을 쓴 3학년의 학생비율은 20%이다. 한 학생을 임이로 불렀을 때 그 학생이 안경을 쓴 학생이라면, 3학년일 확률 P(A|B)를 구해보자 3학년 학생을 A, 안경을 쓴 학생을 B라고하면 P(A|B) = P(AB)/P(B) = 0.35 / 0.7 전체 학년에서 안경을 쓴 학생이 0.7, 해당되는 교집합 (..

Question 베르누이 분포 / 이항 분포 / 카테고리 분포 / 다항 분포 / 가우시안 정규 분포 / T 분포 / 카이제곱 분포 / F 분포 / 베타 분포 / 감마 분포 / 디리클레 분포에 대해 설명해주세요. 혹시 연관된 분포가 있다면 연관 관계를 설명해주세요. 베르누이 분포 - 먼저 베르누이 시행(Bernoulli Trial)이라는 것은 성공과 실패 두가지 결과만이 존재하는 시행으로서, 각 시행은 서로 독립 인 것을 말한다. - 성공률이 p인 실험에서 성공이면 X = 1, 실패이면 X = 0이라 할 때 위 식을 만족하는 확률변수 X가 따르는 확률분포를 의미하며, 이항분포의 특수한 사례에 속한다. 이항 분포 - 성공률이 p인 베르누이 시행을 n번 반복시행할 때 성공횟수를 나타내는 확률변수 K의 분포를 ..

Question. 누적 분포 함수와 확률 밀도 함수는 무엇일까요? 수식과 함께 표현해주세요 누적 분포 함수(Cumulative Distribution Function, CDF) 주어진 확률변수가 특정 값보다 작거나 같을 확률을 나타내는 함수 주사위에서 3 이하의 값이 나올 확률은 3/6 이다. 누적 밀도 함수의 특징 F(-∞) = 0 F(∞) = 1 F(x) ≥ F(y) (if x > y) 확률밀도함수(probability density function, PDF) 연속확률변수 X에 대해서 F(x)가 누적분포함수 일 때 X의 확률밀도함수 f(x)는 아래와 같이 정의한다. 연속확률변수의 분포를 나타내는 연속확률분포에서 특정 구간의 확률을 나타내기 위한 함수로 특정 확률변수의 크기(=넓이)를 나타내는 값이다...
Question 확률 모형과 확률 변수는 무엇일까요? 확률변수 (random variable)란? 변수란 특정 조건에 따라 변하는 값을 의미한다. 확률변수는 확률에 따라 변하는 값을 의미한다. 확률변수의 다양한 정의 - 확률변수의 정의는 무작위 실험을 했을 때, 특정 확률로 발생하는 각각의 결과를 수치로 표현한 변수이다. - 확률변수는 일반적으로 X로 표기하며 확률로 표기하기 위한 event를 정의하는 것이다. - 확률변수(random variable)란, 확률현상에 기인해 결과값이 확률적으로 정해지는 변수를 의미한다. 이 때 확률변수의 값을 셀 수 있는지 없는지에 따라 이산확률변수, 연속확률변수로 나눈다. 이산확률변수란, 확률변수가 취할 수 있는 모든 값들이 하나씩 셀 수 있는 경우이다. 주사위나 동전..
Question 샘플링과 리샘플링에 대해 설명해주세요. 리샘플링은 무슨 장점이 있을까요? 샘플링이란? 샘플링(sampling)은 어떤 자료에서 일부 값을 추출하는 것을 의미한다. 통계학에서의 샘플링은 모집단에서 표본을 추출하는 일을 말한다. 관심 대상의 모집단에 관한 정보를 얻기 위한 의도로 개별적 관측을 선택하는 통계적수행, 가설검증의 일부이다. 이 샘플링 기법에는 단순무작위추출, 층화추출, 계통추출등의 방법이 있다. + 머신러닝이나 딥러닝에서 데이터 샘플링은 데이터를 정리하여 최적의 입력데이터로 만드는 과정을 말하며 데이터 샘플링을 통해 더욱 빠르고 성능이 좋은 모델을 효과적으로 학습시킬 수 있다. 리샘플링이란? 샘플링된 데이터를 다시 샘플링하는 것을 리샘플링(Resampling) 이라고 한다. 모집..