Python 데이터 분석

one-sample t 검정 : 문제3

코딩탕탕 2022. 11. 8. 10:18

[one-sample t 검정 : 문제3] 

 

https://www.price.go.kr/tprice/portal/main/main.do 에서 

메뉴 중  가격동향 -> 개인서비스요금 -> 조회유형:지역별, 품목:미용 자료(엑셀)를 파일로 받아 미용 요금을 얻도록 하자

정부에서는 전국 평균 미용 요금이 15000원이라고 발표하였다. 이 발표가 맞는지 검정하시오.

 

# [one-sample t 검정 : 문제3] 
# https://www.price.go.kr/tprice/portal/main/main.do 에서 
# 메뉴 중  가격동향 -> 개인서비스요금 -> 조회유형:지역별, 품목:미용 자료(엑셀)를 파일로 받아 미용 요금을 얻도록 하자. 
# 정부에서는 전국 평균 미용 요금이 15000원이라고 발표하였다. 이 발표가 맞는지 검정하시오.

# 귀무 : 전국 평균 미용 요금이 15000원이다.
# 대립 : 전국 평균 미용 요금이 15000원이 아니다.

data2 = pd.read_excel("개인서비스지역별_동향[2022-10월]118-10시11분.xls").T.dropna().iloc[2:,]
# excel 파일 불러오기
data2.columns = ['미용']
print(data2)
print(np.mean(data2.미용)) # 17367.5625 vs 15000 차이?

result3 = stats.ttest_1samp(data2.미용, popmean = 15000)
print('t-value : %.6f, p-value : %.6f'%result3)
# 해석 : p-value: 0.000227 < 0.05 이므로 귀무가설 기각. 전국 평균 미용 요금이 15000원이 아니다.


<console>
       미용
서울  20385
부산  16714
대구  20500
인천  20500
광주  17800
대전  16600
울산  15000
경기  17476
강원  17889
충북  16143
충남  17100
전북  13500
전남  16889
경북  16308
경남  16077
제주  19000
17367.5625
t-value : 4.814710, p-value : 0.000227