분류 전체보기
-
자바 step12 - UtilClass(HashMap, Map, HashSet 객체) - 5Java 2022. 11. 15. 19:00
HashMap package test.main; import java.util.ArrayList; import java.util.HashMap; import java.util.Scanner; public class MainClass09 { public static void main(String[] args) { HashMap dic=new HashMap(); dic.put("house", "집"); dic.put("phone", "전화기"); dic.put("car", "자동차"); dic.put("pencil", "연필"); dic.put("eraser", "지우개"); /* * 검색할 단어를 입렵하세요: house * house 의 뜻은 집입니다. * * 검색할 단어를 입력하세요: gura * gur..
-
단순선형회귀, 다중선형회귀 예제(2), 회귀분석모형의 적절성을 위한 5가지 조건Python 데이터 분석 2022. 11. 15. 18:02
# 선형회귀분석 모델 import numpy as np import pandas as pd import matplotlib.pyplot as plt import statsmodels.api plt.rc('font', family = 'malgun gothic') import seaborn as sns import statsmodels.formula.api as smf # 여러 매체의 광고비에 따른 상품 판매량(매출액) 데이터 사용 advdf = pd.read_csv('../testdata/Advertising.csv', usecols = [1,2,3,4]) # 0번째 열은 빼고 읽기 print(advdf.head(3), advdf.shape) # (200, 4) print(advdf.info()) # 단..
-
단순선형회귀, 다중선형회귀 예제Python 데이터 분석 2022. 11. 15. 16:55
# 회귀분석 문제 2) # testdata에 저장된 student.csv 파일을 이용하여 세 과목 점수에 대한 회귀분석 모델을 만든다. # 이 회귀문제 모델을 이용하여 아래의 문제를 해결하시오. 수학점수를 종속변수로 하자. # - 국어 점수를 입력하면 수학 점수 예측 # - 국어, 영어 점수를 입력하면 수학 점수 예측 import numpy as np import pandas as pd import matplotlib.pyplot as plt import statsmodels.api plt.rc('font', family = 'malgun gothic') import seaborn as sns import statsmodels.formula.api as smf df = pd.read_csv('../tes..
-
Python 데이터분석 기초 50 - 귀납적 추론, 연역적 추론, 단순선형회귀 예제(mtcars), 키보드로 값 받기Python 데이터 분석 2022. 11. 15. 15:49
# mtcars dataset으로 단순/다중회귀 모델 작성 : ols() 사용 import numpy as np import pandas as pd import matplotlib.pyplot as plt import statsmodels.api plt.rc('font', family = 'malgun gothic') import seaborn as sns import statsmodels.formula.api as smf mtcars = statsmodels.api.datasets.get_rdataset('mtcars').data print(mtcars.head(3)) # print(mtcars.corr()) print(np.corrcoef(mtcars.hp,mtcars.mpg)[0,1]) # -0.7..
-
단회귀분석(선형회귀분석) OLS 예제(iris dataset으로 모델 생성)Python 데이터 분석 2022. 11. 15. 14:57
# 선형회귀분석 : iris dataset으로 모델 생성 # 약한 상관관계 변수, 강한 상관관계 변수로 모델 작성 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import statsmodels.formula.api as smf iris = sns.load_dataset('iris') print(iris.head(3)) print(type(iris)) print(iris.corr()) # 상관관계 호출 print('연습1 : 약한 상관관계 변수 - sepal_length, sepal_width') result1 = smf.ols(formula = 'sepal_length ~ sepal_width', data = iris..
-
Python 데이터분석 기초 49 - 단회귀분석(선형회귀분석) OLS summary(요약결과) 보는 방법Python 데이터 분석 2022. 11. 15. 13:02
# 단순선형회귀 모델 # 기본적인 결정론적 선형회귀방법 : 독립변수에 대해 대응하는 종속변수와 유사한 예측값을 출력하는 함수 f(x)(= wx + b)를 찾는 작업이다. import pandas as pd df = pd.read_csv('../testdata/drinking_water.csv') print(df.head(3)) print(df.corr()) # 상관관계 출력 import statsmodels.formula.api as smf # 적절성이 만족도에 영향을 준다라는 가정하에 모델 생성 model = smf.ols(formula = '만족도 ~ 적절성', data = df).fit() # 종속변수 ~ 독립변수, fit()함수는 학습하는 합수 print(model.summary()) # 생성된 ..
-
Python 데이터분석 기초 48 - 회귀분석 문제 1 - linregress 사용Python 데이터 분석 2022. 11. 15. 11:12
# 회귀분석 문제 1) scipy.stats.linregress() statsmodels ols(), LinearRegression 사용 # 나이에 따라서 지상파와 종편 프로를 좋아하는 사람들의 하루 평균 시청 시간과 운동량에 대한 데이터는 아래와 같다. # - 지상파 시청 시간을 입력하면 어느 정도의 운동 시간을 갖게 되는지 회귀분석 모델을 작성한 후에 예측하시오. # - 지상파 시청 시간을 입력하면 어느 정도의 종편 시청 시간을 갖게 되는지 회귀분석 모델을 작성한 후에 예측하시오. # 참고로 결측치는 해당 칼럼의 평균 값을 사용하기로 한다. 이상치가 있는 행은 제거. 운동 10시간 초과는 이상치로 한다. from scipy import stats import numpy as np import pand..
-
Python 데이터분석 기초 47 - 회귀분석(선형회귀분석) 방법[linregress]Python 데이터 분석 2022. 11. 15. 10:52
# 방법4 : linregress를 사용. model O from scipy import stats import numpy as np import pandas as pd import matplotlib.pyplot as plt # iq 에 따른 시험점수 예측 score_iq = pd.read_csv('../testdata/score_iq.csv') print(score_iq.head(3)) print(score_iq.info()) # 구조 출력 print(score_iq.corr()) # 상관관계 출력 x = score_iq.iq y = score_iq.score print(np.corrcoef(x, y)[0, 1]) # numpy로는 두 개밖에 볼 수 없다. 0.8822203446134701(피어슨상관..