분류 전체보기
-
decision tree 관련 설치Python 데이터 분석 2022. 11. 21. 10:44
https://graphviz.org/_pages/Download/Download_windows.html https://graphviz.org/download/ graphviz.org 위의 경로에서 다운로드 후 패스 걸어야 된다. 설치 완료되었다. 혹시나 안 될 경우는 이클립스를 껐다가 다시 켜주면 된다. C:\>pip install pydotplus C:\>pip install graphviz 아나콘다 프롬프트에서 위 설치 pit로 되지 않는 다면 아나콘다가 다운되어있기 때문에 conda 를 적어서 상용해 볼 수 있다.
-
Python 데이터분석 기초 57 - ROC curve, acc(정확도), recall(재현율), precision(정밀도), specificity(특이도), fallout(위양성률), fallout(위양성률)Python 데이터 분석 2022. 11. 18. 15:29
# ROC curve # ROC 커브는 모든 가능한 threshold에 대해 분류모델의 성능을 평가하는 데 사용됩니다. # ROC 커브 아래의 영역을 AUC (Area Under thet Curve)라 합니다. from sklearn.datasets import make_classification from sklearn.linear_model import LogisticRegression import pandas as pd import numpy as np from sklearn.metrics import confusion_matrix x, y = make_classification(n_samples = 100, n_features = 2, n_redundant = 0, random_state = 123..
-
Python 데이터분석 기초 55 - Logistic Regression : 다항분류 (얘는 활성화 함수로 softmax - 결과값을 확률로 반환), 표준Python 데이터 분석 2022. 11. 18. 12:41
# Logistic Regression : 다항분류 (얘는 활성화 함수로 softmax - 결과값을 확률로 반환) # Logistic Regression은 다중 클래스를 지원하도록 일반화 되어 있다. softmax 함수를 사용하기 때문이다. # iris dataset을 사용 - 꽃의 종류를 세가지로 분류한다. import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn import model_selection from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split from sklearn.m..
-
Logistic Regression(로지스틱 회귀분석) 예제(당뇨 데이터), 로지스틱 회귀분석 후 저장 후 불러쓰기Python 데이터 분석 2022. 11. 18. 10:58
# pima-indians-diabetes dataset으로 당뇨병 유무 분류 모델 import pandas as pd from sklearn import model_selection from sklearn.linear_model import LogisticRegression url = "https://raw.githubusercontent.com/pykwon/python/master/testdata_utf8/pima-indians-diabetes.data.csv" names = ['Pregnancies', 'Glucose', 'BloodPressure', 'SkinThickness', 'Insulin', 'BMI', 'DiabetesPedigreeFunction', 'Age', 'Outcome'] df..
-
Logistic Regression(로지스틱 회귀분석) 예제(외식 데이터)Python 데이터 분석 2022. 11. 17. 17:46
# [로지스틱 분류분석 문제1] # 문1] 소득 수준에 따른 외식 성향을 나타내고 있다. 주말 저녁에 외식을 하면 1, 외식을 하지 않으면 0으로 처리되었다. # 다음 데이터에 대하여 소득 수준이 외식에 영향을 미치는지 로지스틱 회귀분석을 실시하라. # 키보드로 소득 수준(양의 정수)을 입력하면 외식 여부 분류 결과 출력하라. import statsmodels.formula.api as smf import numpy as np import pandas as pd import statsmodels.api as sm from sklearn.model_selection import train_test_split df2 = pd.read_csv('../testdata/eat_out.csv') df = df2.l..
-
Logistic Regression(로지스틱 회귀분석) 예제(날씨 데이터) - train_test_split(과적합 방지), 머신러닝의 포용성(inclusion, tolerance)Python 데이터 분석 2022. 11. 17. 17:12
# 날씨정보 데이터로 이항분류 : 내일 비가 올지? import statsmodels.formula.api as smf import numpy as np import pandas as pd import statsmodels.api as sm from sklearn.model_selection import train_test_split data = pd.read_csv('../testdata/weather.csv') print(data.head(2), data.shape) # (366, 12) data2 = pd.DataFrame() data2 = data.drop(['Date','RainToday'], axis = 1) data2['RainTomorrow'] = data2['RainTomorrow'].m..
-
Python 데이터분석 기초 54 - Logistic Regression(로지스틱 회귀분석)Python 데이터 분석 2022. 11. 17. 15:28
종속변수와 독립변수 간의 관계로 예측모델을 생성한다는 점에서 선형회귀분석과 유사하다. 하지만 독립변수(x)에 의해 종속변수(y)의 범주로 분류한다는 측면에서 분류분석 방법이다. 분류 문제에서 선형 예측에 시그모이드 함수를 적용하여 가능한 각 불연속 라벨 값에 대한 확률을 생성하는 모델로 이진분류 문제에 흔히 사용되지만 다중클래스 분류(다중 클래스 로지스틱 회귀 또는 다항회귀)에도 사용될 수 있다. 독립변수 : 연속형, 종속변수 : 범주형 뉴럴네트워크(신경망)에서 사용된다. # Logistic Regression # 종속변수와 독립변수 간의 관계로 예측모델을 생성한다는 점에서 선형회귀분석과 유사하다. 하지만 # 독립변수(x)에 의해 종속변수(y)의 범주로 분류한다는 측면에서 분류분석 방법이다. 분류 문제에..