본문 바로가기

study

통계적 추론의 이해

통계적 추론

  • 통계적 추론: 표본의 정보를 이용해 모집의 모수를 판단하는 것
  • 표본의 통계량과 표집분포의 특성을 이용함
  1. 모수의 값에 대한 추정 (점추정)
  2. 모수의 신뢰구간에 대한 추정(구간추정)
  3. 모수에 대한 가설 검증(가설검증)

모집평균에 대한 점추정

모집평균에 대한 추정

표본에서 계산할 수 있는 통계량 중 모집평균을 추정하는데 사용할 수 있는 가장 좋은 통계량은?

  • 표집분포의 특성
    • 표본평균의 표집분포의 평균은 모집평균과 같음
  • 모집 평균을 추정할 수 있는 수치는 표본의 평균
    • 중학교 1학년 남학생의 평균키는 30명의 표본 평균인 160.2cm 이다

모집평균 추정의 정확성(신뢰도)

  • 표본평균은 새로운 표본마다 다른 값을 갖게 되며 모집평균의 정확한 추정값이 아님
  • 모집평균 추정의 신뢰성의 정도를 나타내는 수치?
    • 평균의 표집분포의 표준편차(표준오차)
  • 표준오차는 표본평균들의 표준오차
  • 표본평균들의 평균 -> 모평균
  • 표준오차가 작다는 것은:
    • 표본평균들 간의 편차가 작음
    • 모평균과 표본평균들과 큰 차이가 나지 않음

모집표준편차에 대한 추정

표본에서 계산 할 수 있는 통계량 중 모집표준편차를 추정하는데 사용할 수 있는 가장 좋은 통계량은?

  • 표본표준편차의 표집분포의 평균은 모집표준편차와 같음
  • $s=\sqrt{\dfrac{\sum(x_i-\overline x)^2}{n-1}}$
  • 예) 중학교 1학년 남학생의 표준편차는 30명의 표본표준편차인 5.99cm 이다

모집평균의 점추정

평균이 μ 이고 표준 편차가 σ 인 모집에서 $n$ 개의 표본 자료를 추출하여 계산한 표본평균이 $\overline x_n$ 라 할 때,

  • 모집의 평균 => 표본평균 $\overline x_n$ 로 추정
  • 표본평균으로 모집평균을 추정할 때 표준오차
    • $\dfrac{ \sigma }{\sqrt n}$ 또는 $\dfrac{s}{\sqrt n}$
  • 예) 30명의 표본자료의 통계량을 고려할 때 중학교 1학년 남학생의 평균은 160.20cm 추정, 이때 추정의 표준오차는 $5.99 / \sqrt 30 = 1.09$

모집평균에 대한 구간추정

신뢰구간

  • 점추정만으로는 모집의 평균을 추정하기 부정확
  • 모집 평균을 포함할 것으로 기대가 되는 구간을 제시하는 것이 유용
  • 신뢰구간
    • 일정 정도의 정확성 혹은 신뢰성을 갖는 추정치의 구간
    • 구간이 모수를 포함할 확률을 기준으로 90% 신뢰구간, 95% 신뢰구간 등으로 표현
  • 신뢰수준: 모수를 포함할 확률

신뢰구간의 계산

  • 만약 표집분포가 이론적 확률 분포를 따른다면 표집분포의 특정 구간에 포함되는 하나의 표본에서 얻어진 표본 통계값의 확률을 계산 가능
  • 모집단이 정규분포를 따르고 모분산을 아는 경우(모평균은 모름)
  • 이를 통해 모수가 어떤 구간에 포함되는지 확률을 계산 가능

평균의 표집분포의 신뢰구간

  • 평균이 μ , 표준편차가 σ 일 때 1. 모집이 정규분포 또는 2. 표분수 $n$ 이 큰 경우(보통 30 이상) 조건에서 평균의 표집분포는 정규분포를 따름

  • 모집분포 -> 평균의 표집분포 -> 평균의 표집분포의 표준화

    ![image-20190416163538582](/Users/kimdabin/Library/Application Support/typora-user-images/image-20

표집분포의 구간확률과 모집평균의 신뢰구간

  • 모집평균 μ 에 대한 신뢰구간

    • 표본의 크기가 크고(정규분포를 따르게 됨-중심극한정리) 평균과 표준편차가 $\overline x_n$ 와 $s$ 일 때 μ 에 대한 $100(1-a)$% 신뢰구간은 아래와 같음
  • 표본평균 - 1.96*표준편차/sqrt(n), 표본평균 + 1.96 *표준편차/sqrt(n) < 이 구간에 95%확률로 모평균이 있을 수 있음
  • 신뢰구간의 의미

    • 신뢰구간은 표본에 따라 달라 달라짐

    • 신뢰구간의 확률(신뢰수준)은 같은 크기의 표본을 무한히 추출할 때 표본에서 얻어진 신뢰구간이 모수를 포함할 확률을 의미

가설검증의 논리

  • 가설 검증의 예

    2000년도에 전국 중학교 1학년 남학생의 키를 조사한 결과 평균키가 158cm 표준편차는 6cm 였다. 2010년에 중학교 1학년 남학생 30명의 키를 측정하여 표본평균 160.20cm 표본표준편차 5.99cm를 얻었다. 위의 조사 결과를 바탕으로 지난 10년간 중학교 1학년 남학생의 평균키가 변했다고 할 수 있을까?

    • 가설: 지난 10년간 중학교 1학년 남학생의 평균키가 변하지 않았다
    • 2010년도 전체 중학교 1학년 남학생의 평균키 는 158cm이다
    • 30명의 표본은 평균이 158cm인 모집에서 얻어졌다
    • 표본크기 30인 표본평균 160.20cm는 모집의 평균이 158cm인 분포에서 얻어졌다고 볼 수 있는 값이다

가설검증

  • 가설: 모집의 모수에 대한 잠정적인 기술
  • 통계적 가설 검증: 설정된 가설이 참이라고 할 때, 표본에서 계산된 통계량이 얻어질 확률을 계산하여 설정된 가설이 그럴 듯 한지 여부를 판단하는 것
  • 반증을 통한 주장
    • 일반적으로 주장하고 싶은 가설의 반대 가설을 참이라고 가정하고 자료를 통해 그 가설이 옳지 않음을 보여주면서 원하는 가설을 주장하는 하는 방식을 취함

가설의 종류

  • 영가설(귀무가설, Null Hypothesis, $H_0$ )
    • 연구에서 주장하고 싶은 내용과 반대되는 가설
    • 일반적으로 연구자가 표본자료를 통해 기각하고자 하는 모수에 대한 잠정적 진술
  • 상대가설(대립가설, Alternative Hypothesis, $H_1$ )
    • 연구에서 주장하고 싶은 내용
    • 일반적으로 연구자가 표본자료를 통해 지지받고자 기대하는 영가설의 반대 진술

통계적 판단

  • 통계적 판단 : 일정한 확률적 기준을 바탕으로 영가설을 기각할 것인지 기각하지 않을 것인지 결정하는 것
  • 옳은 판단
    • 영가설이 참일 때 영가설을 기각하지 않는 것
    • 영가설이 거짓일 때 영가설을 기각하는 것
  • 잘못된 판단(판단오류)
    • 영가설이 참일 때 영가설을 기각하는 것(1종 오류)
    • 영가설이 거짓일 때 영가설을 기각하지 않는 것(2종 오 류)
$H_0$ 기각 X $H_0$ 기각 O
$H_0$ 참 옳은 판단 1종 오류
$H_0$ 거짓 2종 오류 옳은 판단

가설검증의 과정

통계적 가설검증의 과정

  1. 주장하려는 내용의 반대 가설을 영가설로 설정

  2. 영가설을 모집의 모수로 표현(예: 모평균 )

  3. 영가설이 참이라고 가정했을 때, 얻을 수 있는 통계량(예: 표본평균) 혹은 검정통계량의 표집분포(예:표준정규분포)를 구함

  4. 가정된 표집분포에서 표본통계량보다 더 극단적인 값이 얻어질 확률을 구함

  5. 이 확률이 매우 낮다면 영가설을 의심

예시

  • 영가설: 2010년 전체 중학교 1학년 남학생의 평균키는 158cm 이다($H_0$: μ = 158)
    • 10년동안 중학교 1학년 남학생들의 키는 크지 않았다
  • 영가설이 참일 때, 크기가 30인 표본평균의 표집분포=N(158, $6^2$/30)
  • 중학교 1학년 남학생 30명 표본의 평균키 160.20cm 보다 극단적인 값이 얻어질 확률은?
  • 표본평균의 표집분포 $$N(158, 6^2/30)$$
    • $H_0$: μ=$E(\overline X_{30})=158$
    • $$\overline x_{30}=160.20$$
  • 표본평균의 표집분포의 표준화 $N(0,1)$
    • $H_0$:μ=$E(\frac {\overline X_{30} - 158 }{6/\sqrt30})=0$
    • $\frac {160.20 - 158 }{6/\sqrt30} =2.01$
    • $z(\overline x_{30})$ = 2.01 => 0.9778
    • $p=.0446$
    • $2\over p $=0.0223

가설검증의 과정

  • 검정통계량(test statistic) : 특정한 확률분포를 따를 것으로 기대되는 표본 통계량의 변환값(예: $z$)
  • 유의수준(significance level, $a$): 영가설을 기각할 것인지 여부를 결정하는 확률적 기준
    • 일반적으로 $a$=.05 또는 $a$=.01 등을 많이 사용
  • 유의확률($p$): 영가설이 참일 때 표본통계량 보다 극단적인 값이 얻어질 확률
    • 표본통계량을 이용하여 영가설을 기각할 수 있는 최소의 유의 수준
  • 유의확률이 유의수준보다 작으면 영가설 기각
    • $p<a \to H_1$
    • 유의확률이 유의수준보다 크면 영가설이 설득력이 있으나, 작으면 영가설의 설득력이 떨어짐
    • 즉, 우연히 발생한 일이 아니다.
  • 유의확률이 유의수준보다 크면 영가설 기각하지 않음
    • $p>a \to H_0$
    • 유의확률이 유의수준보다 작으면 영가설이 설득력이 있기때문에 영가설을 기각하지 않음
  • 기각역(critical region) : 설정된 유의수준에 대응하는, 검정통계량이 포함되면 영가설을 기각하는 구간
  • 기각값(critical value) : 기각역과 비기각역을 구분하는 값
  • 검정통계량이 기각역에 포함되면 영가설을 기각
    • 검정통계량이 기각값보다 극단적인 값
    • $|z(\overline x_n)|>z_{a/2} \to H_1$
  • 검정통계량이 기각역에서 벗어나면 영가설을 기각하지 않음
    • 기각값이 검정통계량보다 극단적인 값
    • $|z(\overline x_n)|<z_{a/2} \to H_0$

예제의 가설검증 과정

  1. 영가설 설정

    $H_0$:μ=158

  2. 표본의 통계량과 표본의 크기 설정

    $\overline X_{30}, n = 30$

  3. 영가설에 따른 통계량의 표집분포 설정

    $\overline X_{30} ~ N(158,6^2/30), Z[= \frac{\overline X_{30}}{6/\sqrt{30}}]~N(0,1)$

  4. 유의수준 설정

    α=.05

  5. 표본통계량 및 검정통계량 계산

    $\overline x_{30} = 160.20$

    $z(\overline x_{30} = 160.20) = \frac{160.2-158}{6/\sqrt{30}}= 2.01$

  6. 가정된 표집분포에서 유의확률 계산

    $p= 2 * P(Z >[ z(\overline x_{30})=2.01])=.0446$

  7. 유의 수준에 따른 기각값(기각역) 설정

    $Z_{a/2} = Z_{.05/2} = Z_{0.25}=1.96$

  8. 유의 확률과 유의 수준 비교

    $[p = .0446] < [a = .05] \to H_1$

  9. 검정통계량고 기각값 비교

    $[\left|z(\overline x_30 = 2.01) \right|]>[z_{.025} = 1.96] \to H_1$

상대가설의 두 가지 종류

영가설이 $H_0: \mu = 158$ 일 때,

  • 상대가설 (양방향) : 양측검증

    • $H_1: \mu \ne 158\ (\mu < 158\ or\ \mu > 158 )$

    • 즉 모평균이 158보다 클지 작을지 는 모르지만 영가설로 설정한 158은 아니다

  • 상대가설(일방향) : 단측검증

    1. $H_1: \mu < 158 $ : 모평균이 158보다 작을 것이다
    2. $H_1: \mu > 158$ : 모평균이 158보다 클 것이다
  • 상대가설이 양방향의 차이에 대한 진술인 경우는 양측검측을 실시

  • 상대가설이 한쪽 방향의 크기에 대한 진술인 경우는 단측검증을 실시

판단 오류의 확률

판단오류

$H_0$ 기각 X $H_0$ 기각 O
$H_0$ 참 옳은 판단 (1-α) 1종 오류(α)
$H_0$ 거짓 2종 오류(β) 옳은 판단(1-β)
  • 1종오류(α)
    • 실제로 효과가 없는데 결과상 효과가 있다고 나오는 오류
    • 귀무가설을 거짓으로 기각
    • 가장 문제가 되는 오류로 학계에서는 이를 5% 미만으로 통제
    • 실제 효과가 없지만 효과가 있다는 결론이 도출될 가능성을 5%미만으로 묶어두어야만 결과의 유효성을 인정함
  • 검정력(1-β)
    • 실제로 효과가 있는 것을 통계 분석을 통해 효과가 있다고 증명할 수 있는 힘
    • 잘못된 귀무가설을 기각하는 능력
  • 2종 오류(β)
    • 실제로 효과가 있지만 결과 상 효과가 없다는 결론을 도출
    • 잘못된 귀무가설을 기각하지 않음
    • 연구 표본수가 작아지면 2종 오류의 가능성이 높아지고 검정력이 감소

'study' 카테고리의 다른 글

t-test  (0) 2020.02.09
표집분포의 이해  (0) 2020.01.08