Python 데이터 분석

Python 데이터분석 기초 32 - t-test(집단 간 차이분석: 평균 또는 비율 차이를 분석), 실습 예제 1) 단일 표본 t 검정 (one-sample t- test)

코딩탕탕 2022. 11. 7. 16:48

 

집단 간 차이분석: 평균 또는 비율 차이를 분석

모집단에서 추출한 표본정보를 이용하여 모집단의 다양한 특성을 과학적으로 추론할 수 있다.

 

T-test와 ANOVA의 차이

- 두 집단 이하의 변수에 대한 평균차이를 검정할 경우 T-test를 사용하여 검정통계량 T값을 구해 가설검정을 한다.

- 세 집단 이상의 변수에 대한 평균차이를 검정할 경우에는 ANOVA를 이용하여 검정통계량 F값을 구해 가설검정을 한다.

 

 

T-test는 표본수가 30미만일 때 사용한다.

 

출처 : https://nittaku.tistory.com/459

 

* 실습 예제 1)  단일 표본 t 검정 (one-sample t- test)

하나의 집단에 대한 표본평균이, 예측된 평균과 차이가 있는지 검증

 

# 집단 간 차이분석: 평균 또는 비율 차이를 분석
# : 모집단에서 추출한 표본정보를 이용하여 모집단의 다양한 특성을 과학적으로 추론할 수 있다.
# * T-test와 ANOVA의 차이
# - 두 집단 이하의 변수에 대한 평균차이를 검정할 경우 T-test를 사용하여 검정통계량 T값을 구해 가설검정을 한다.
# - 세 집단 이상의 변수에 대한 평균차이를 검정할 경우에는 ANOVA를 이용하여 검정통계량 F값을 구해 가설검정을 한다.

# * 단일 모집단의 평균에 대한 가설검정(one samples t-test) # t-test는 표본수가 30개 미만일때 사용 가능하다.
# 독립변수 : 범주형
# 종속변수 : 연속형


import numpy as np
import scipy.stats as stats
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

# 실습 예제 1) 단일 표본 t 검정 (one-sample t- test)
# 하나의 집단에 대한 표본평균이, 예측된 평균과 차이가 있는지 검증
# 어느 남성 집단의 평균 키 검정
# 귀무 : 집단의 평균 키가 170이다.
# 대립 : 집단의 평균 키가 170가 아니다.

one_sample = [167.0, 182.7, 169.6, 176.8, 185.0]
print(np.array(one_sample).mean()) # 176.21999999999997
print('정규성 확인 :', stats.shapiro(one_sample))  # pvalue = 0.5400 > 0.05 이므로 만족
result = stats.ttest_1samp(one_sample, popmean = 170) # 평균 키 popmean = 170
print('result : statistic(t-value) : {}, p-value : {}'.format(result[0], result[1]))
# 해석 : p-value : 0.15224 < 0.05 이므로 귀무가설 채택. 집단의 평균 키가 170이다.

# 실습 예제 1)
# A중학교 1학년 1반 학생들의 시험결과가 담긴 파일을 읽어 처리 (국어 점수 평균검정) student.csv
# 하나의 집단에 대한 표본평균이, 예측된 평균과 차이가 있는지 검증


<console>
176.21999999999997
정규성 확인 : ShapiroResult(statistic=0.921559751033783, pvalue=0.5400515794754028)
result : statistic(t-value) : 1.765478785690093, p-value : 0.15224038187120442

새로운 샘플 데이터를 가지고 평균 키(주어진 값 : 170)에 근사한지 안 한지의 여부를 묻는 것이 one-sample t- test 이다.