일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Journal Review
- 중앙갑
- 백준
- 그리디
- Stack
- p-value
- Deeplearning
- DP
- ML
- anomaly detection
- 알고리즘
- Python
- 스택
- 자료구조
- classification
- 큐
- datascience
- 구현
- Queue
- Game Data Analysis
- AA test
- Machine learning
- cs231n
- 딥러닝
- 7569번
- c++
- 정렬
- Anti Cheat
- 통계
- BFS
- Today
- Total
목록분류 전체보기 (77)
Software Hyena::
Question : A/B Test 등 현상 분석 및 실험 설계 상 통계적으로 유의미함의 여부를 결정하기 위한 방법에는 어떤 것이 있을까요? A/B Test란 기존의 서비스 A 와 새로운 서비스 B를 통계적인 방법으로 비교하여 새로운 서비스가 효과가 있는지 검정하는 방법이다. A/B 테스트를 통해 인과관계를 찾아내려면, 두 집단을 나눌때 random으로 나누기 참가한 두 집단에 속하는 표본들이 random 추출을 통해 샘플링 되어야 한다. 이외에 현상 분석 및 실험 설계 상 통계적으로 유의미함의 여부를 결정하기 위한 방법에는 AA test, p-value가 있다. AA test는 A와 B를 비교하기 전에 분산된 트래픽에 모두 A안을 보여주고, 동일한 Variation이 관측되는지 확인하는 방법 p-val..
Question : p-value는 요즘 시대에도 여전히 유효할까요? 언제 p-value가 실제를 호도하는 경향이 있을까요? p-value의 한계점은 다음과 같다. 1. 관측치가 많을수록 p값이 작아진다. -> 관측치가 많으면 p-value가 유의하게 나올 가능성이 커진다. 즉, p-value가 통계적 유의성을 따지기 위한 올바른 척도가 될 수 없다. 2. 유의한 p-value값과 통계 방법론을 제시한다. -> 유의하지 않은 변수를 제거하여 유의한 변수만을 활용하는 눈속임이 가능하다. 통계적 방법론을 조작할 가능성도 존재한다. 관측치가 p-value 를 이용하여도 적당할 만큼의 수이고 유의한 변수만을 활용하는 등의 눈속임을 하지 않는다면 유용하게 사용할 수 있다고 생각한다. - ref https://ni..
Question : p-value를 고객에게는 뭐라고 설명하는 게 이해하기 편할까요? p-value 의 사전적정의는 다음과 같다. 통계적 가설 검정에서 유의 확률(significance probability, asymptotic significance) 또는 p-값(p-value, probability value)은 귀무가설이 맞다고 가정할 때 얻은 결과보다 극단적인 결과가 실제로 관측될 확률이다.실험 의 유의확률은 실험 의 표본공간에서 정의되는 확률변수로서, 0~1 사이의 값을 가진다. p-값(p-value)은 귀무가설이 맞다는 전제 하에, 표본에서 실제로 관측된 통계치와 '같거나 더 극단적인' 통계치가 관측될 확률이다. 여기서 말하는 확률은 '빈도주의' (frequentist) 확률이다. 정의를 보았..
https://www.acmicpc.net/problem/11399 11399번: ATM 첫째 줄에 사람의 수 N(1 ≤ N ≤ 1,000)이 주어진다. 둘째 줄에는 각 사람이 돈을 인출하는데 걸리는 시간 Pi가 주어진다. (1 ≤ Pi ≤ 1,000) www.acmicpc.net 문제 인하은행에는 ATM이 1대밖에 없다. 지금 이 ATM앞에 N명의 사람들이 줄을 서있다. 사람은 1번부터 N번까지 번호가 매겨져 있으며, i번 사람이 돈을 인출하는데 걸리는 시간은 Pi분이다. 사람들이 줄을 서는 순서에 따라서, 돈을 인출하는데 필요한 시간의 합이 달라지게 된다. 예를 들어, 총 5명이 있고, P1 = 3, P2 = 1, P3 = 4, P4 = 3, P5 = 2 인 경우를 생각해보자. [1, 2, 3, 4,..
https://www.acmicpc.net/problem/11047 11047번: 동전 0 첫째 줄에 N과 K가 주어진다. (1 ≤ N ≤ 10, 1 ≤ K ≤ 100,000,000) 둘째 줄부터 N개의 줄에 동전의 가치 Ai가 오름차순으로 주어진다. (1 ≤ Ai ≤ 1,000,000, A1 = 1, i ≥ 2인 경우에 Ai는 Ai-1의 배수) www.acmicpc.net 문제 준규가 가지고 있는 동전은 총 N종류이고, 각각의 동전을 매우 많이 가지고 있다. 동전을 적절히 사용해서 그 가치의 합을 K로 만들려고 한다. 이때 필요한 동전 개수의 최솟값을 구하는 프로그램을 작성하시오. 입력 첫째 줄에 N과 K가 주어진다. (1 ≤ N ≤ 10, 1 ≤ K ≤ 100,000,000) 둘째 줄부터 N개의 줄에..

Question 신뢰 구간의 정의는 무엇인가요? 통계학에서 신뢰 구간(confidence interval)은 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법이다. 모수를 하나의 값으로 추정하기 보다는 구간으로 추정하는 것이 좀 더 좋은 방법이다. 모수를 추정하기 위하여 만든 구간을신뢰구간 이라고 하며 신뢰구간은 점추정치에 적당한 값을 빼고 더하여 만든다. 평균이 μ, 표준편차가 σ가 0 정규분포의 모집단에서 표본 n개를 뽑아 모평균을 추정할떄 표본 n개의 표본 평균 X_bar 의 분포는 N(μ,σ/√n)이므로 다음 등식이 성립한다. 단, 여기서 z_(α/2)는 Z가 표준정규분포를 따르는 확률변수일 때 다음 식을 만족하는 값이다. 따라서 다음 구간이 모평균 μ를 포함할 확률은 1−α 이다. α가 ..

https://www.acmicpc.net/problem/7569 7569번: 토마토 첫 줄에는 상자의 크기를 나타내는 두 정수 M,N과 쌓아올려지는 상자의 수를 나타내는 H가 주어진다. M은 상자의 가로 칸의 수, N은 상자의 세로 칸의 수를 나타낸다. 단, 2 ≤ M ≤ 100, 2 ≤ N ≤ 100, www.acmicpc.net 문제 철수의 토마토 농장에서는 토마토를 보관하는 큰 창고를 가지고 있다. 토마토는 아래의 그림과 같이 격자모양 상자의 칸에 하나씩 넣은 다음, 상자들을 수직으로 쌓아 올려서 창고에 보관한다. 창고에 보관되는 토마토들 중에는 잘 익은 것도 있지만, 아직 익지 않은 토마토들도 있을 수 있다. 보관 후 하루가 지나면, 익은 토마토들의 인접한 곳에 있는 익지 않은 토마토들은 익은 ..
https://www.acmicpc.net/problem/17503 17503번: 맥주 축제 첫 번째 줄에 축제가 열리는 기간 N (1 ≤ N ≤ 200,000) 과, 채워야 하는 선호도의 합 M (1 ≤ M
https://www.acmicpc.net/problem/14235 14235번: 크리스마스 선물 크리스마스에는 산타가 착한 아이들에게 선물을 나눠준다. 올해도 산타는 선물을 나눠주기 위해 많은 노력을 하고 있는데, 전세계를 돌아댕기며 착한 아이들에게 선물을 나눠줄 것이다. 하지만 www.acmicpc.net 문제 크리스마스에는 산타가 착한 아이들에게 선물을 나눠준다. 올해도 산타는 선물을 나눠주기 위해 많은 노력을 하고 있는데, 전세계를 돌아댕기며 착한 아이들에게 선물을 나눠줄 것이다. 하지만 산타의 썰매는 그렇게 크지 않기 때문에, 세계 곳곳에 거점들을 세워 그 곳을 방문하며 선물을 충전해 나갈 것이다. 또한, 착한 아이들을 만날 때마다 자신이 들고있는 가장 가치가 큰 선물 하나를 선물해 줄 것이다...

Question. 공분산과 상관계수는 무엇일까요? 수식과 함께 표현해주세요 공분산 (Covariance) 공분산이란 2개의 확률변수의 상관관계의 정도를 나타내는 값이다. 공분산의 값이 양수라면, 두 확률변수는 양의 선형 관계가 있고, 공분산의 값이 음수라면 두 확률변수는 음의 선형관계가 있다. 또, 공분산은 아래와 같은 성질을 가진다. 같은 확률변수에 대한 공분산은 확률변수의 분산과 같으며, Cov(X,Y) = Cov(Y,X)로 동일하다. 또한, Cov(aX, bY)의 경우 ab Cov(X, Y)와 같다. 피어슨 상관계수에 사용되는 표본 공분산은 다음과 같다. 상관계수 (Correlation Coefficient) 상관계수는 두 변수 사이의 통계적 관계를 표현하기 위해 특정한 상관관계의 정도를 수치적으로..