정규모집단의 평균추론
구간 추정을 할때는 모집이 정규분포를 따르거나 표본이 크고 모분산을 알고 있을 때 할 수 있다. 모분산을 모르거나 모집단이 정규분포를 따르지 않고 표본의 수가 충분히 크지 않을 때는 어떻게 모수를 추론할 수 있을까?
평균의 표집분포의 추정
모집표준편차에 대한 추정
모집의 표준편차를 알 수 없을 때, 표본에서 계산 된 표준편차를 이용해 모집의 표준편차를 추정함
모집표준편차의 추정값(표본의 표준편차)
예) 중학교 1학년 남학생의 표준편차는 30명의 표본표준편차인 5.99 이다
모집의 표준편차를 추정할 때 평균의 표집분포의 특성
평균의 표집분포의 평균은 모집의 평균(μ)과 같음
표집분포의 표준편차(표준오차)의 추정값은
표본평균을 표준화한 검정통계량은 표준정규분포와 유사하지만 차이가 있는 t분포를 따름
t 분포의 이해
표준정규분포와 스튜던트 t 분포
자유도
- 통계량 계산에 사용되는 관측 데이터(변수) 중, 자유롭게 값을 취할 수 있는 데이터의 수
- 표본 크기에서 제약 조건의 수를 뺀 값이 자유도의 크기
- 제약 조건의 수는 표본 데이터를 사용한 계산식의 수
t분포의 특성
평균이 0인 대칭형 분포
자유도에 따라 달라짐
평균에서의 확률값은 표준정규분포보다 작음
꼬리부분에서의 확률값은 표준정규분포보다 큼
특정한 누적확률값을 값는 t값은 동일한 누적확률값을 갖는 z값보다 평균 0에 더 멀리 떨어져 있음
자유도가 증가할 수록 표준정규분포에 가까워짐
- 자유도가 무한대인 t 분포는 표준정규분포와 같음
t 분포를 이용한 모집평균의 추정
표본 평균과 표준편차를 이용한 모집평균의 점추정
- 모집의 평균(μ)은 표본의 평균을 이용해 추정
- 표준오차의 추정값은
- 예: 30명의 표본자료의 통계량을 고려할 때 중학교 1학년 남학생의 평균은 160.20 로 추정, 추정의 표준오차의 추정값은 5.99/ = 1.09
표본 평균과 표준편차를 이용한 모집평균의 신뢰구간 추정
모집의 평균을 포함할 확률이 인 신뢰구간은
예) 중학교 1학년 남학생 평균키의 95% 신뢰구간
표본 평균과 표준편차를 이용한 모집평균에 대한 가설 검증
모집평균이 μ 라는 영가설 하에 유의수준 α에 대응하는 기각값이 (단측검증) 또는 (양측검증)라 할 때
표본평균으로 계산된 검정통계량이 기각역에 포함되면(기각값보다 표본평균이 극단적인 값이면) 영가설을 기각
- 단측 검증 :
- 양측 검증 :
표본평균으로 계산된 검정통계량이 기각역에 포함되지 않으면(표본평균이 기각값보다 작으면) 영가설을 기각하지 않음
- 단측 검증 :
- 양측 검증 :
검정통계량은 표본평균에서 모평균의 편차를 구한 뒤, 표준오차로 나눠줌
표본 평균과 표준편차를 이용한 모집평균에 대한 가설검증
영가설 : 2010년도 중학교 1학년 남학생의 평균키는 158cm 이다
- 30명의 표본평균 160.2, 표본표준편차 5.99 로 계산된 검증통계량 값(t)은 2.02이다
- 유의 수준이 .05 일 때, 기각값은 2.045() 이다
- 검증통계량 보다 기각값이 더 극단적이므로 영가설은 기각되지 않는다
- 따라서 중학교 1학년 남학생의 평균키는 158cm가 아니라고 보기 어렵다
두 모집평균의 비교
두 모집평균의 비교의 예
예시
- 여자의 우울점수 평균은 남자의 우울점수 평균보다 높은 가?
- 인지행동치료는 최면요법보다 우울증에 더 효과적인가?
- 명상은 불안을 감소시키는가?
두 개의 비교 집단
여자 | 남자
인지행동집단 | 최면집단
명산 전 | 명상 후
두 모집평균의 비교
- 여자의 우울점수 평균은 남자의 우울점수 평균보다 높은가?
- 인지행동치료 집단의 우울점수 평균은 최면요법 집단의 우울점수 평균보다 더 낮은가?
- 명상 수행 후 불안점수 평균은 명상 수행전 불안점수 평균보다 더 낮은가?
두 집단의 평균의 비교는 두 집단 평균의 차이를 표현
- 0과 같다
- 0보다 크다
- 0보다 작다
두 집단의 평균을 추론하는 것은 두 집단의 차이에 대해 추론하는 것과 같음
예) 여자의 우울평균과 남자의 우울평균은 다른가?
- 여자의 평균 우울점수와 남자의 평균 우울점수의 차이는 0이 아니라고 할 수 있는가?
표본평균을 이용한 모집평균의 비교
두 모집의 모평균이 동일한지 판단하기 위해서는 각 모집의 표본에서 계산된 평균값을 비교
실제 두 모집의 평균이 같아도 표집오차 때문에 두 표본의 평균은 차이를 갖음
두 집단의 평균에 대해 추론하기 위해서는 두 표본 평균 차이의 표집분포를 알아야함
표본평균 차이의 표집분포
표본평균 차이의 표집분포의 특성
두 표본평균 차이의 표집분포의 평균은 모집 평균 차이와 같음
두 표본평균 차이의 표집분포의 분산은 각 집단의 평균의 표집분포의 분산(표준오차)을 더해준 값과 같음
두 모집이 정규분포를 따르거나/ 각 집단의 표본의 크기가 모두 충분히 크다면 평균차이의 표집분포도 정규분포를 따른다고 볼수 있음
모집의 분산(표준편차)을 추정해야 할 때
두 모집의 분산이 다른 경우
두 모집의 분산이 동일한 경우(공통분산)
두 모집평균차의 추정
두 모집평균차의 점 추정
추정값
추정의 표준오차
두 모집평균차의 구간추정
% 신뢰구간
두 모집평균차의 가설검증
t 검정을 이용한 평균 비교의 과정
영가설 설정
- 두 집단의 평균의 차이가 없다
각 표본의 평균 및 그 차이 계산
검정통계량(t 값) 계산
- 이라고 가정함
검정통계량의 분포설정
- 집단이 두 개
유의수준 설정
- α = .05 또는 α = .01
기각값 계산 (t 분포표 참조)
- 양방향 검증:
- 단방향 검증 :
검정통계량과 기각값을 비교
- 양방향 검증 :
- 단방향 검증 :
t 검정 프로그램을 사용하는 경우 컴퓨터가 유 의확률을 계산해 주므로 유의확률이 유의수준 보다 낮으면 영가설을 기각, 높으면 영가설 채택
짝비교
t검정(t 분포를 이용한 검정)을 이용한 평균의 비교
독립 t 검정: 두 개의 독립적인 집단의 평균 차이에 대한 추론에 사용
- 예) it 직업 종사자 집단/ 무역 직업 종사자 집단
대응 t 검정(짝비교): 두 개의 관련된 집단의 평균 차이에 대한 추론에 사용
- 예) 신약 복용 전 / 신약 복용 후
짝비교의 과정
- 짝을 이루는 두 모집의 차이 점수 평균()에 대해 추론
- 표본에서 짝을 이루는 두 점수의 차이점수()를 계산한 후 그 평균 ()으로 모집의 차이점수 평균에 대해 점추정, 구간추정, 가설검증을 수행
표본평균 차이의 표집분포의 특성
다음의 조건일 때, 점수 차이의 평균의 표집분포도 정규분포를 따름
- 두 모집이 정규분포를 따를 때
- 표본의 크기가 모두 충분히 클 때
하나의 집단이므로 df = n-1
모집 차이점수 평균에 대한 구간 추정
% 신뢰구간
평균의 차이점수에 대한 가설 검증
영가설 설정: 두 집단의 평균은 차이가 없다
차이점수의 평균 및 분산 계산
검정통계량 계산
'study' 카테고리의 다른 글
통계적 추론의 이해 (0) | 2020.02.07 |
---|---|
표집분포의 이해 (0) | 2020.01.08 |