-
Python 데이터분석 기초 40 - 추론통계 분석 중 비율(value)검정Python 데이터 분석 2022. 11. 10. 09:53
추론통계 분석 중 비율검정
- 비율검정 특징
: 집단의 비율이 어떤 특정한 값과 같은지를 검증.
: 비율 차이 검정 통계량을 바탕으로 귀무가설의 기각여부를 결정.one-sample : 비율이 제시된 경우
two-sample : 비율이 제시되지 않은 경우
# 추론통계 분석 중 비율검정 # - 비율검정 특징 # : 집단의 비율이 어떤 특정한 값과 같은지를 검증. # : 비율 차이 검정 통계량을 바탕으로 귀무가설의 기각여부를 결정. # # one-sample : 비율이 제시된 경우 # A회사에는 100명 중에 45명이 흡연을 한다. 국가 통계를 보니 국민 흡연율은 35%라고 한다. # 비율이 같냐? 비율의 동일여부를 검정하시오. # 귀무 : A회사의 흡연율과 국민 흡연율의 비율은 같다. # 대립 : A회사의 흡연율과 국민 흡연율의 비율은 다르다. import numpy as np from statsmodels.stats.proportion import proportions_ztest count = np.array([45]) nobs = np.array([100]) z, p = proportions_ztest(count = count, nobs = nobs, value = 0.35) # value 는 국민 흡연율 35프로를 의미 print('z : {}, p : {}'.format(z, p)) # 해석 : p : 0.04442318 < 0.05 이므로 귀무 기각. # A회사의 흡연율과 국민 흡연율의 비율은 다르다. # # two-sample : 비율이 제시되지 않은 경우 # A회사 사람들 300명 중 100명이 커피를 마시고, B회사 사람들 400명 중 170명이 커피를 마셨다. # 비율이 같냐? # 귀무 : 비율이 같다. # 대립 : 비율이 다르다. count = np.array([100, 170]) nobs = np.array([300, 400]) z, p = proportions_ztest(count = count, nobs = nobs, value = 0) # 비율이 제시되지 않았을 경우 value는 0을 준다. print('z : {}, p : {}'.format(z, p)) # 해석 : p : 0.01367 < 0.05 이므로 귀무 기각. # A회사의 흡연율과 국민 흡연율의 비율은 다르다. <console> z : [2.01007563], p : [0.04442318] z : -2.4656701201792273, p : 0.013675721698622408
proportions_ztest(count = count, nobs = nobs, value = 0.35) 에서 value는 비율을 의미한다.
'Python 데이터 분석' 카테고리의 다른 글
Python 데이터분석 기초 42 - 머신 런닝이란? (0) 2022.11.10 Python 데이터분석 기초 41 - 이항검정(양측검정, 단측검정) (0) 2022.11.10 Python 데이터분석 기초 39 - Two-way ANOVA(이원분산분석) (0) 2022.11.09 ANOVA 예제 1, 2(정규성, 등분산성 검정, 사후 검정) 귀무 vs 대립 (1) 2022.11.09 Python 데이터분석 기초 38 - 어느 음식점 매출 자료와 날씨 자료를 활용하여 온도(추움, 보통, 더움)에 따른 매출액 평균에 차이를 검정 + 웹 (0) 2022.11.09