본문 바로가기

study

t-test

t-test

정규모집단의 평균추론

구간 추정을 할때는 모집이 정규분포를 따르거나 표본이 크고 모분산을 알고 있을 때 할 수 있다. 모분산을 모르거나 모집단이 정규분포를 따르지 않고 표본의 수가 충분히 크지 않을 때는 어떻게 모수를 추론할 수 있을까?

 

평균의 표집분포의 추정

모집표준편차에 대한 추정

  • 모집의 표준편차를 알 수 없을 때, 표본에서 계산 된 표준편차를 이용해 모집의 표준편차를 추정함

  • 모집표준편차의 추정값(표본의 표준편차)

  • 예) 중학교 1학년 남학생의 표준편차는 30명의 표본표준편차인 5.99 이다

 

모집의 표준편차를 추정할 때 평균의 표집분포의 특성

  • 평균의 표집분포의 평균은 모집의 평균(μ)과 같음

  • 표집분포의 표준편차(표준오차)의 추정값은

  • 표본평균을 표준화한 검정통계량은 표준정규분포와 유사하지만 차이가 있는 t분포를 따름

 

t 분포의 이해

표준정규분포와 스튜던트 t 분포

image-20190420051205080

  • 자유도

    • 통계량 계산에 사용되는 관측 데이터(변수) 중, 자유롭게 값을 취할 수 있는 데이터의 수
    • 표본 크기에서 제약 조건의 수를 뺀 값이 자유도의 크기
    • 제약 조건의 수는 표본 데이터를 사용한 계산식의 수

image-20190420051222990

t분포의 특성

  • 평균이 0인 대칭형 분포

  • 자유도에 따라 달라짐

  • 평균에서의 확률값은 표준정규분포보다 작음

  • 꼬리부분에서의 확률값은 표준정규분포보다 큼

  • 특정한 누적확률값을 값는 t값은 동일한 누적확률값을 갖는 z값보다 평균 0에 더 멀리 떨어져 있음

  • 자유도가 증가할 수록 표준정규분포에 가까워짐

    • 자유도가 무한대인 t 분포는 표준정규분포와 같음

 

t 분포를 이용한 모집평균의 추정

표본 평균과 표준편차를 이용한 모집평균의 점추정

  • 모집의 평균(μ)은 표본의 평균을 이용해 추정
  • 표준오차의 추정값은
  • 예: 30명의 표본자료의 통계량을 고려할 때 중학교 1학년 남학생의 평균은 160.20 로 추정, 추정의 표준오차의 추정값은 5.99/ = 1.09

 

표본 평균과 표준편차를 이용한 모집평균의 신뢰구간 추정

  • 모집의 평균을 포함할 확률이 인 신뢰구간은

  • 예) 중학교 1학년 남학생 평균키의 95% 신뢰구간

표본 평균과 표준편차를 이용한 모집평균에 대한 가설 검증

모집평균이 μ 라는 영가설 하에 유의수준 α에 대응하는 기각값이 (단측검증) 또는 (양측검증)라 할 때

  • 표본평균으로 계산된 검정통계량이 기각역에 포함되면(기각값보다 표본평균이 극단적인 값이면) 영가설을 기각

    • 단측 검증 :
    • 양측 검증 :
  • 표본평균으로 계산된 검정통계량이 기각역에 포함되지 않으면(표본평균이 기각값보다 작으면) 영가설을 기각하지 않음

    • 단측 검증 :
    • 양측 검증 :
  • 검정통계량은 표본평균에서 모평균의 편차를 구한 뒤, 표준오차로 나눠줌

 

표본 평균과 표준편차를 이용한 모집평균에 대한 가설검증

영가설 : 2010년도 중학교 1학년 남학생의 평균키는 158cm 이다

  • 30명의 표본평균 160.2, 표본표준편차 5.99 로 계산된 검증통계량 값(t)은 2.02이다
  • 유의 수준이 .05 일 때, 기각값은 2.045() 이다
  • 검증통계량 보다 기각값이 더 극단적이므로 영가설은 기각되지 않는다
  • 따라서 중학교 1학년 남학생의 평균키는 158cm가 아니라고 보기 어렵다

 

두 모집평균의 비교

두 모집평균의 비교의 예

예시

  1. 여자의 우울점수 평균은 남자의 우울점수 평균보다 높은 가?
  2. 인지행동치료는 최면요법보다 우울증에 더 효과적인가?
  3. 명상은 불안을 감소시키는가?

 

두 개의 비교 집단

  1. 여자 | 남자

  2. 인지행동집단 | 최면집단

  3. 명산 전 | 명상 후

두 모집평균의 비교

  1. 여자의 우울점수 평균은 남자의 우울점수 평균보다 높은가?
  2. 인지행동치료 집단의 우울점수 평균은 최면요법 집단의 우울점수 평균보다 더 낮은가?
  3. 명상 수행 후 불안점수 평균은 명상 수행전 불안점수 평균보다 더 낮은가?
  • 두 집단의 평균의 비교는 두 집단 평균의 차이를 표현

    • 0과 같다
    • 0보다 크다
    • 0보다 작다
  • 두 집단의 평균을 추론하는 것은 두 집단의 차이에 대해 추론하는 것과 같음

  • 예) 여자의 우울평균과 남자의 우울평균은 다른가?

    • 여자의 평균 우울점수와 남자의 평균 우울점수의 차이는 0이 아니라고 할 수 있는가?
표본평균을 이용한 모집평균의 비교
  • 두 모집의 모평균이 동일한지 판단하기 위해서는 각 모집의 표본에서 계산된 평균값을 비교

  • 실제 두 모집의 평균이 같아도 표집오차 때문에 두 표본의 평균은 차이를 갖음

  • 두 집단의 평균에 대해 추론하기 위해서는 두 표본 평균 차이의 표집분포를 알아야함

    image-20190425172552730

     

표본평균 차이의 표집분포

표본평균 차이의 표집분포의 특성

  • 두 표본평균 차이의 표집분포의 평균은 모집 평균 차이와 같음

  • 두 표본평균 차이의 표집분포의 분산은 각 집단의 평균의 표집분포의 분산(표준오차)을 더해준 값과 같음

  • 두 모집이 정규분포를 따르거나/ 각 집단의 표본의 크기가 모두 충분히 크다면 평균차이의 표집분포도 정규분포를 따른다고 볼수 있음

 

모집의 분산(표준편차)을 추정해야 할 때

  1. 두 모집의 분산이 다른 경우

     

  2. 두 모집의 분산이 동일한 경우(공통분산)

  3.  

두 모집평균차의 추정

두 모집평균차의 점 추정

  • 추정값

 

  • 추정의 표준오차

 

두 모집평균차의 구간추정

  • % 신뢰구간

     

두 모집평균차의 가설검증

t 검정을 이용한 평균 비교의 과정

  1. 영가설 설정

    1. 두 집단의 평균의 차이가 없다
  2. 각 표본의 평균 및 그 차이 계산

  3. 검정통계량(t 값) 계산

    1. 이라고 가정함
  4. 검정통계량의 분포설정

    1. 집단이 두 개
  5. 유의수준 설정

    1. α = .05 또는 α = .01
  6. 기각값 계산 (t 분포표 참조)

    1. 양방향 검증:
    2. 단방향 검증 :
  7. 검정통계량과 기각값을 비교

    1. 양방향 검증 :
    2. 단방향 검증 :
  8. t 검정 프로그램을 사용하는 경우 컴퓨터가 유 의확률을 계산해 주므로 유의확률이 유의수준 보다 낮으면 영가설을 기각, 높으면 영가설 채택

 

짝비교

t검정(t 분포를 이용한 검정)을 이용한 평균의 비교

  • 독립 t 검정: 두 개의 독립적인 집단의 평균 차이에 대한 추론에 사용

    • 예) it 직업 종사자 집단/ 무역 직업 종사자 집단
  • 대응 t 검정(짝비교): 두 개의 관련된 집단의 평균 차이에 대한 추론에 사용

    • 예) 신약 복용 전 / 신약 복용 후

짝비교의 과정

  • 짝을 이루는 두 모집의 차이 점수 평균()에 대해 추론
  • 표본에서 짝을 이루는 두 점수의 차이점수()를 계산한 후 그 평균 ()으로 모집의 차이점수 평균에 대해 점추정, 구간추정, 가설검증을 수행

표본평균 차이의 표집분포의 특성

  • 다음의 조건일 때, 점수 차이의 평균의 표집분포도 정규분포를 따름

    • 두 모집이 정규분포를 따를 때
    • 표본의 크기가 모두 충분히 클 때
  • 하나의 집단이므로 df = n-1

모집 차이점수 평균에 대한 구간 추정

  • % 신뢰구간

    •  

평균의 차이점수에 대한 가설 검증

  • 영가설 설정: 두 집단의 평균은 차이가 없다

  • 차이점수의 평균 및 분산 계산

  • 검정통계량 계산

 

'study' 카테고리의 다른 글

통계적 추론의 이해  (0) 2020.02.07
표집분포의 이해  (0) 2020.01.08