본문 바로가기

study

표집분포의 이해

표집분포의 이해

모수(Parameter)와 통계량

  • 추론: 주어진 표본으로부터 모집단의 성격을 추측하는 것
  • 모수: 수치로 표현되는 모집단의 특성(모평균, 모분산 등등)
  • 통계량: 표본의 관측값들에 의해 결정되는 표본자료의 특성
  • 추정: 통계량을 사용하여 모수를 추론하는 것

통계량의 특징

  • 표본의 통계량은 모수의 추정치이지만 일반적으로 모수의 참값과 일치 하지 않음
  • 통계량의 값은 추출된 표본에 영향을 받음
  • 같은 크기(표본수)의 표본이라도 새로운 표본을 추출할 때 마다 통계량의 값은 변함

통계량의 확률분포

표집분포

  • 하나의 모집에서 서로 다른 많은 표본이 추출될 수 있음
  • 각 표본마다 계산된 통계량도 서로 다른 값을 갖음
  • 통계량의 값은 그 자체가 확률변수가 됨
  • 통계량들의 분포로 확률분포를 만들 수 있음
  • 하나의 모집에서 추출할 수 있는 가능한 모든 표본에서 계산된 통계량의 확률 분포를 표집분포라고 함

모집단을 알고 있을 때 통계량의 표집분포 구하기

  • 모든 가능한 표본을 나열
  • 각 표본에서 통계량을 구함
  • 통계량이 취하는 각 값에 대응되는 확률을 계산
  • 한계
    • 모집단을 알고 있어도 모집과 표본의 크기가 커지면 모든 표집을 찾아 통계량의 표집분포를 구하기 어려움
    • 모집단의 크기가 큰 경우는 표집 분포의 특성을 이용해 통계량의 표집 분포를 추정 가능

표본평균 표집분포의 특성

  • 평균의 표집분포의 기대값(평균)과 분산은 다음과 같은 특성이 있음
  • 평균의표집분포의 기대값(평균의 평균)은 모집단의 평균과 같음
  • 평균의 표집분포의 분산모집의 분산을 표본 크기 $n$으로 나누어준 값과 같음
    • 표본을 많이 뽑을 수록 표집분포는 촘촘해지기 때문에(반비례하기 때문에) 분산이 작아짐
    • 표준오차가 작다 = 평균의 표집분포의 폭이 좁다 = 표본평균이 모평균과 가깝다

image-20190412193327316

  • 모집이 정규분포가 아닐 때(중심극한정리)
    • 표본의 크기가 큰 경우(보통 30 이상) 표본크기 $n$인 평균의 표집 분포는 평균이 $μ$ , 분산이 $σ^2/n$인 정규분포와 매우 유사함
    • 표본의 크기가 커질 수록 평균의 표집분포는 정규분포에 더 가까워짐

'study' 카테고리의 다른 글

t-test  (0) 2020.02.09
통계적 추론의 이해  (0) 2020.02.07