분류 전체보기
-
TensorFlow 기초 23 - iris dataset 분류 모델 여러개 생성 후 성능 비교. 최종 모델 ROC curve 표현(모델 = 함수 사용)TensorFlow 2022. 12. 6. 12:28
# iris dataset 분류 모델 여러개 생성 후 성능 비교. 최종 모델 ROC curve 표현 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.preprocessing import OneHotEncoder, StandardScaler iris = load_iris() print(iris.keys()) x = iris.data print(x[:2]) y = iris.target print(y[:2]) names = iris.target_names # 꽃의 종류명 print(..
-
TensorFlow 기초 22 - zoo animal dataset으로 동물의 type을 7가지로 분류(다항분)TensorFlow 2022. 12. 6. 11:14
# zoo animal dataset으로 동물의 type을 분류 from keras.models import Sequential from keras.layers import Dense import numpy as np from keras.utils import to_categorical xy = np.loadtxt('https://raw.githubusercontent.com/pykwon/python/master/testdata_utf8/zoo.csv', delimiter=',') print(xy[0], xy.shape) x_data = xy[:, 0:-1] y_data = xy[:, -1] print(x_data[0]) print(y_data[0], ' ', set(y_data)) # {0.0, 1.0..
-
TensorFlow 기초 21 - diabetes 데이터로 이항분류(sigmoid)와 다항분류(softmax) 처리TensorFlow 2022. 12. 6. 10:47
# diabetes 데이터로 이항분류(sigmoid)와 다항분류(softmax) 처리 from keras.models import Sequential from keras.layers import Dense import numpy as np dataset = np.loadtxt('https://raw.githubusercontent.com/pykwon/python/master/testdata_utf8/diabetes.csv', delimiter=',') print(dataset[:1]) print(dataset.shape) # (759, 9) # print(dataset[:, -1]) # 이항분류 from sklearn.model_selection import train_test_split x_train,..
-
TensorFlow 기초 20 - classification(이항분류 wine dataset), 학습 조기 종료, 모델 학습 시 모니터링 결과를 파일로 저장TensorFlow 2022. 12. 2. 17:00
# red&white wine dataset으로 분류 모델 작성 from keras.models import Sequential from keras.layers import Dense from keras.callbacks import EarlyStopping, ModelCheckpoint import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split wdf = pd.read_csv('../testdata/wine.csv', header=None) print(wdf.head(2)) print(wdf.info()) print(wdf.iloc[:, 12..
-
TensorFlow 기초 19 - classificationTensorFlow 2022. 12. 2. 16:19
classification : 주어진 feature에 대해 label로 학습시켜 데이터를 분류하는 방법 # classification : 주어진 feature에 대해 label로 학습시켜 데이터를 분류하는 방법 # hΘ(x) = P(y=1|x;Θ) x = feature, Θ = model parameter # hypothesis function의 출력값은 "주어진 featue x라는 값을 가질 때 class 1에 들어갈 확률"이라는 의미 # P(y = 0 | x;Θ) + P(y = 1 | x;Θ) = 1 # 로지스틱 회귀 분석 실습 소스) 2.x import numpy as np from tensorflow.keras.models import Sequential from tensorflow.keras.l..
-
TensorFlow 기초 18 - 다항회귀(Polynomial Regression)TensorFlow 2022. 12. 2. 15:32
최소제곱법으로 회귀선 구하기 방법과 tf로 회귀선 구하기 방법2로 나눠서 작성했다. # 다항회귀 : Polynomial Regression - 비선형 데이터인 경우 다항식을 이용하여 다항회귀 처리 가능 # tesnorflow를 이용하여 2차함수 회귀선 그리기 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt plt.rc('font', family='malgun gothic') plt.rcParams['axes.unicode_minus'] = False import random """ # 다항 회귀 연습용 데이터 : 지역별 인구증가율과 고령인구비율(통계청 시각화 자료에서 발췌) x = [0.3, -0.78, 1.26, 0...
-
TensorFlow 기초 17 - 현대차 가격예측 모델(function api 사용 방법, GradientTape 객체 사용 방법)TensorFlow 2022. 12. 2. 13:00
# 현대차 가격예측 모델 import pandas as pd from sklearn.preprocessing import OneHotEncoder from sklearn.compose import make_column_transformer import numpy as np import tensorflow as tf train_df = pd.read_excel('../testdata/hd_carprice.xlsx', sheet_name='train') test_df = pd.read_excel('../testdata/hd_carprice.xlsx', sheet_name='test') print(train_df.head(2), train_df.shape) # (71, 11) print(test_df.head..
-
TensorFlow 기초 16 - AutoMPG dataset으로 자동차 연비 예측 모델(표준화)TensorFlow 2022. 12. 2. 11:20
# AutoMPG dataset으로 자동차 연비 예측모델 import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import tensorflow as tf from keras import layers dataset = pd.read_csv('../testdata/auto-mpg.csv', na_values='?') # na_values='?' na를 ?표로 대체함 print(dataset.head(2)) del dataset['car name'] print(dataset.corr()) dataset.drop(['acceleration', 'model year', 'origin'], axis='columns', inplace=Tr..