분류 전체보기
-
t-test 검정 문제(1) 정규성 확인Python 데이터 분석 2022. 11. 8. 17:14
[two-sample t 검정 : 문제1] 다음 데이터는 동일한 상품의 포장지 색상에 따른 매출액에 대한 자료이다. 포장지 색상에 따른 제품의 매출액에 차이가 존재하는지 검정하시오. blue : 70 68 82 78 72 68 67 68 88 60 80 red : 60 65 55 58 67 59 61 68 77 66 66 작성자 코드 # [two-sample t 검정 : 문제1] # 다음 데이터는 동일한 상품의 포장지 색상에 따른 매출액에 대한 자료이다. # 포장지 색상에 따른 제품의 매출액에 차이가 존재하는지 검정하시오. import numpy as np import scipy.stats as stats import pandas as pd import matplotlib.pyplot as plt # 귀..
-
서로 대응인 두 집단의 평균 차이 검정(paired samples t-test) 예제Python 데이터 분석 2022. 11. 8. 15:41
실습) 9명의 환자를 대상으로 복부 수술 전 몸무게와 복부 수술 후 몸무게 변화 # 실습) 9명의 환자를 대상으로 복부 수술 전 몸무게와 복부 수술 후 몸무게 변화가 있는지 검증 baseline = [67.2, 67.4, 71.5, 77.6, 86.0, 89.1, 59.5, 81.9, 105.5] follow_up = [62.4, 64.6, 70.4, 62.6, 80.1, 73.2, 58.2, 71.0, 101.0] # 귀무 : 복부 수술 전 몸무게와 복부 수술 후 몸무게 변화는 없다. # 대립 : 복부 수술 전 몸무게와 복부 수술 후 몸무게 변화는 있다. print(np.mean(baseline), ' ', np.mean(follow_up)) # 78.4 vs 71.5 print(stats.ttest_..
-
Python 데이터분석 기초 35 - 서로 대응인 두 집단의 평균 차이 검정(paired samples t-test)Python 데이터 분석 2022. 11. 8. 15:19
# * 서로 대응인 두 집단의 평균 차이 검정(paired samples t-test) # 처리 이전과 처리 이후를 각각의 모집단으로 판단하여, 동일한 관찰 대상(한 개의 집단)으로부터 처리 이전과 처리 이후를 1:1로 대응시킨 두 집단으로 부터 # 의 표본을 대응표본(paired sample, 동일표본)이라고 한다. # 대응인 두 집단의 평균 비교는 동일한 관찰 대상으로부터 처리 이전의 관찰과 이후의 관찰을 비교하여 영향을 미친 정도를 밝히는데 주로 사용 # 하고 있다. 집단 간 비교가 아니므로 등분산 검정을 할 필요가 없다. # 즉, 하나의 집단에 대해 독립변수를 적용하기 전과 후의 종속변수의 수준을 측정하고, 이들의 평균 차이를 통계적으로 확인. # 집단 간 비교가 아니므로 등분산 검정은 필요하지 ..
-
Python 데이터분석 기초 35 - 어느 음식점 매출 자료와 날씨 자료를 활용하여 강수 여부에 따른 매출액 평균에 차이를 검정Python 데이터 분석 2022. 11. 8. 15:03
전혀 다른 데이터이지만 서로 merge 해서 데이터를 만들었다. 데이터 타입 바꾸기, 데이터 안에 들어있는 -를 공백으로 바꾸기, 두 데이터 병합 등의 내용이 들어있다. # 어느 음식점 매출 자료와 날씨 자료를 활용하여 강수 여부에 따른 매출액 평균에 차이를 검정 # 귀무 : 강수 여부에 따른 음식점 매출액의 평균에 차이가 없다. # 대립 : 강수 여부에 따른 음식점 매출액의 평균에 차이가 있다. import numpy as np import scipy.stats as stats import pandas as pd import matplotlib.pyplot as plt # 데이터는 data.go.kr을 참조 # 매출 자료 sales_data = pd.read_csv("https://raw.githubu..
-
Python 데이터분석 기초 34 - 서로 독립인 두 집단의 평균 차이 검정(independent samples t-test), 정규성, 등분산성Python 데이터 분석 2022. 11. 8. 12:19
예제 1) # 두 집단의 가설검정 – 실습 시 분산을 알지 못하는 것으로 한정하겠다. # * 서로 독립인 두 집단의 평균 차이 검정(independent samples t-test) # 남녀의 성적, A반과 B반의 키, 경기도와 충청도의 소득 따위의 서로 독립인 두 집단에서 얻은 표본을 독립표본(two sample)이라고 한다. from scipy import stats import pandas as pd from numpy import average # 실습) 남녀 두 집단 간 파이썬 시험의 평균 차이 검정 male = [75, 85, 100, 72.5, 86.5] female = [63.2, 76, 52, 100, 70] # 귀무 : 남녀 두 집단 간 파이썬 시험의 평균에 차이가 없다. # 대립 : ..
-
one-sample t 검정 : 문제3Python 데이터 분석 2022. 11. 8. 10:18
[one-sample t 검정 : 문제3] https://www.price.go.kr/tprice/portal/main/main.do 에서 메뉴 중 가격동향 -> 개인서비스요금 -> 조회유형:지역별, 품목:미용 자료(엑셀)를 파일로 받아 미용 요금을 얻도록 하자. 정부에서는 전국 평균 미용 요금이 15000원이라고 발표하였다. 이 발표가 맞는지 검정하시오. # [one-sample t 검정 : 문제3] # https://www.price.go.kr/tprice/portal/main/main.do 에서 # 메뉴 중 가격동향 -> 개인서비스요금 -> 조회유형:지역별, 품목:미용 자료(엑셀)를 파일로 받아 미용 요금을 얻도록 하자. # 정부에서는 전국 평균 미용 요금이 15000원이라고 발표하였다. 이 발표가..
-
one-sample t 검정 : 문제2(데이터 공백제거, to_numeric)Python 데이터 분석 2022. 11. 8. 10:05
[one-sample t 검정 : 문제2] 국내에서 생산된 대다수의 노트북 평균 사용 시간이 5.2 시간으로 파악되었다. A회사에서 생산된 노트북 평균시간과 차이가 있는지를 검정하기 위해서 A회사 노트북 150대를 랜덤하게 선정하여 검정을 실시한다. 실습 파일 : one_sample.csv 참고 : time에 공백을 제거할 땐 ***.time.replace(" ", "") print('----------------------') # [one-sample t 검정 : 문제2] # 국내에서 생산된 대다수의 노트북 평균 사용 시간이 5.2 시간으로 파악되었다. # A회사에서 생산된 노트북 평균시간과 차이가 있는지를 검정하기 위해서 A회사 노트북 150대를 랜덤하게 선정하여 검정을 실시한다. # 귀무 : 국내에..
-
one-sample t 검정 : 문제1Python 데이터 분석 2022. 11. 8. 09:54
[one-sample t 검정 : 문제1] 영사기에 사용되는 구형 백열전구의 수명은 250시간이라고 알려졌다. 한국연구소에서 수명이 50시간 더 긴 새로운 백열전구를 개발하였다고 발표하였다. 연구소의 발표결과가 맞는지 새로 개발된 백열전구를 임의로 수집하여 수명시간 관련 자료를 얻었다. 한국연구소의 발표가 맞는지 새로운 백열전구의 수명을 분석하라. 305 280 296 313 287 240 259 266 318 280 325 295 315 278 # [one-sample t 검정 : 문제1] # 영사기에 사용되는 구형 백열전구의 수명은 250시간이라고 알려졌다. # 한국연구소에서 수명이 50시간 더 긴 새로운 백열전구를 개발하였다고 발표하였다. # 연구소의 발표결과가 맞는지 새로 개발된 백열전구를 임의로..