분류 전체보기
-
Python 데이터분석 기초 3 - 배열 연산, 벡터 간 내적 연산, 파일 저장, 불러오기Python 데이터 분석 2022. 10. 28. 16:16
# 배열 연산 import numpy as np x = np.array([[1,2],[3,4]], dtype = np.float64) # 데이터 타입을 지정 가능 print(x, x.dtype) y = np.arange(5, 9).reshape(2,2) y = y.astype(np.float32) print(y, y.dtype) print() print(x + y) # 행열 덧셈 print(np.add(x,y)) # 같은 방법(속도가 더 빠르다) imsi = np.random.rand(1000000) print(imsi) print(sum(imsi)) # 파이썬의 함수(속도 느림) print(np.sum(imsi)) # numpy의 함수(속도 빠름) print() print(x - y) print(np...
-
Python 데이터분석 기초 2 - Numpy(배열), list vs NumpyPython 데이터 분석 2022. 10. 28. 13:21
# numpy import numpy as np ss = ['tom', 'james', 'oscar', 1] print(ss, type(ss)) # ss2 = np.array(ss) print(ss2, type(ss2)) # # numpy 배열은 배열 안에 , 가 들어가지 않는다. # numpy는 배열 안에 같은 type만 들어가야 되므로 위를 예로들면 숫자가 들어가도 Str 타입으로 들어간다. # 메모리 비교(list vs numpy) li = list(range(1, 11)) print(li) print(li[0], li[1], id(li[0]), id(li[1])) # 별도의 객체 주소를 기억 print(li * 10) # 10번 출력한다. print() num_arr = np.array(li) p..
-
Python 데이터분석 기초 1 - Numpy(합, 평균, 분산, 표준편차)Python 데이터 분석 2022. 10. 28. 13:00
# Numpy는 C언어로 구현된 파이썬 라이브러리로써, 고성능의 수치계산과 선형대수학을 위해 제작되었다. # Numerical Python의 줄임말이기도 한 Numpy는 벡터 및 행렬 연산에 있어서 매우 편리한 기능을 제공한다. grades = [1, 3, -2, 4] # 변량 def grades_sum(grades): # 합을 구하는 함수 tot = 0 for g in grades: tot += g return tot def grades_avg(grades): # 평균값을 구하는 함수 tot = grades_sum(grades) ave = tot / len(grades) return ave def grades_variance(grades): # 편차제곱의 평균 : 분산 ave = grades_avg(g..
-
R 기초 36 - # 비계층적 군집분석R 2022. 10. 28. 11:38
# 비계층적 군집분석 # K-Means 군집분석을 가장 많이 사용 : K(군집 수)를 얼마? data
-
R 기초 34 - 머신러닝의 종류(지도 학습, 비지도 학습, 강화 학습)R 2022. 10. 28. 09:45
지도 학습(Supervised Learning) 지도 학습이란 말 그대로 정답이 있는 데이터를 활용해 데이터를 학습시키는 것이다. 입력 값(X data)이 주어지면 입력값에 대한 Label(Y data)를 주어 학습시키는 것을 말한다. 예를 들어 인물 사진과 동물 사진을 주어 이건 사람이고 이건 동물이야라고 알려주는 학습 방식이다. 따라서 기계가 정답을 잘 맞췄는지 아닌지를 쉽게 알 수 있다. 비지도 학습(Unsupervised Learning) 비지도 학습이란 지도 학습과 다르게 정답 라벨이 없는 데이터를 비슷한 특징끼리 군집화 하여 새로운 데이터에 대한 결과를 예측하는 것이다. 라벨링 되어있지 않은 데이터로부터 패턴이나 형태를 찾아야 하기 때문에 지도학습보다는 조금 더 난이도가 있다. 강화 학습(Re..
-
R 기초 32 - K-최근접 이웃(K-Nearest Neighbor, KNN)R 2022. 10. 27. 16:24
# K-최근접 이웃(K-Nearest Neighbor, KNN) # 분류와 회귀 모두 더 가까운 이웃일수록 더 먼 이웃보다 평균에 더 많이 기여하도록 이웃의 기여에 # 가중치를 주고 분류 및 회귀를 하는 모델 install.packages("ggvis") library(ggvis) library(class) # 랜덤을 위한 시드 값 세트 set.seed(1234) # 트레이닝-테스트로 67%, 33%씩 나눈다. random_samples