-
확률변수, 샘플, 샘플사이즈Statistics/기본개념 2022. 6. 6. 17:26
* 오류가 있을수도 있으니 의견 있으실시 댓글로 부탁드립니다.
- scalar, vector 형태인지 헷갈려서 정리(이해를 위한 개념상으로만 참고)
- 확률변수 X
- scalar?
- called as random variable
- $$ X_1, X_2, ... X_n $$
- 각각의 random variable을 조합한 것을 estimator라 칭한다. (예 : \(\bar{X})\)
- one sample
- sample size = 1일때 scalar
- $$ x_1 $$
- sample size > 1일때는 vector
- $$ x_1, x_2,…,x_n $$
- x_i는 X_i의 observed version.
- sample size = 1일때 scalar
- sample size
- number of x_i in one sample
- x_1, x_2,…,x_n 이라면 n이 sample size
- sample statistics(parameter estimates)
- 위의 sample로 계산된 모수를 추정하는 추정치. 예) \(\bar{x})\
- point estimates 말고도 신뢰구간 등이 있음.(구간 추정치)
- 위의 sample로 계산된 모수를 추정하는 추정치. 예) \(\bar{x})\
- number of samples
- 샘플을 몇번 추출할 것인지이다. 이건 생각보다 통계학 개념에서는 거론되지 않는 듯한데, 계속 헷갈렸다. 거론되지 않는 이유는 현실적으로 샘플 추출은 1번…혹은 소수로 하기 때문인듯하다. 실험 여러번 할 수 없는 여건상, 하나의 샘플가지고 모수 추정하고 싶은데, 그러면 추정치의 분포를 알면, 얼마나 지금 샘플이 그럴듯한 추정치인지 알 수 있게 됨… 결국 통계학의 한 축인 estimation과 연결되는데, https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=kjihoon0914&logNo=221215303504 여기에 해당 내용이 잘 정리되어있다.
- CLT에서는 sample size vs. number of sample?
sample size이다. sample size -> infinity 로 갈때, 표본평균의 분포가 정규분포를 따른다.
Reference :