Python 데이터 분석
one-sample t 검정 : 문제3
코딩탕탕
2022. 11. 8. 10:18
[one-sample t 검정 : 문제3]
https://www.price.go.kr/tprice/portal/main/main.do 에서
메뉴 중 가격동향 -> 개인서비스요금 -> 조회유형:지역별, 품목:미용 자료(엑셀)를 파일로 받아 미용 요금을 얻도록 하자.
정부에서는 전국 평균 미용 요금이 15000원이라고 발표하였다. 이 발표가 맞는지 검정하시오.
# [one-sample t 검정 : 문제3]
# https://www.price.go.kr/tprice/portal/main/main.do 에서
# 메뉴 중 가격동향 -> 개인서비스요금 -> 조회유형:지역별, 품목:미용 자료(엑셀)를 파일로 받아 미용 요금을 얻도록 하자.
# 정부에서는 전국 평균 미용 요금이 15000원이라고 발표하였다. 이 발표가 맞는지 검정하시오.
# 귀무 : 전국 평균 미용 요금이 15000원이다.
# 대립 : 전국 평균 미용 요금이 15000원이 아니다.
data2 = pd.read_excel("개인서비스지역별_동향[2022-10월]118-10시11분.xls").T.dropna().iloc[2:,]
# excel 파일 불러오기
data2.columns = ['미용']
print(data2)
print(np.mean(data2.미용)) # 17367.5625 vs 15000 차이?
result3 = stats.ttest_1samp(data2.미용, popmean = 15000)
print('t-value : %.6f, p-value : %.6f'%result3)
# 해석 : p-value: 0.000227 < 0.05 이므로 귀무가설 기각. 전국 평균 미용 요금이 15000원이 아니다.
<console>
미용
서울 20385
부산 16714
대구 20500
인천 20500
광주 17800
대전 16600
울산 15000
경기 17476
강원 17889
충북 16143
충남 17100
전북 13500
전남 16889
경북 16308
경남 16077
제주 19000
17367.5625
t-value : 4.814710, p-value : 0.000227