R
-
R 기초 21 - 선형회귀분석(회귀식 적합도에 대한 가설 검정)R 2022. 10. 26. 10:33
# 회귀식 적합도에 대한 가설 검정 # iris dataset head(iris, 3) cor(iris[,-5]) #-를 붙이면 여집합이 된다. cor(iris$Sepal.Length, iris$Sepal.Width) # -0.1175698, 음의 상관관계가 약하다 plot(iris$Sepal.Length, iris$Sepal.Width) # Sepal.Length가 Sepal.Width 에 영향을 주는가? # 선형회귀분석 model1 # 정량적인 분석 모델을 만들 때, 회귀분석을 쓴다. model1
-
R 기초 20 - 단순선형회귀 모델 예제, 회귀분석모형의 적절성을 위한 조건R 2022. 10. 25. 17:17
임의의 heigt가 주어졌을 때 미지의 weight를 데이터로 분석해서 예측값을 추측하는 예제 # 단순선형회귀 모델 작성 head(women, 2) summary(women) cor(women$height, women$weight) # 0.9954948. 표준화를 하여 -1 ~ 1로 나타낸다. 상관관계인지의 여부 확인 plot(women$height, women$weight) # 인과관계가 있다고 가정하고 회귀분석 모델 작성 mfit
-
R 기초 18 - 통계분석, 기술통계, 표준화, 정규화, 변동계수, 공분산, 상관계수R 2022. 10. 25. 13:02
정규화와 표준화 정의 참조 [통계] 정규화(Normalization) vs 표준화(Standardization) ML을 공부하는 사람이라면 feature scaling이 얼마나 중요한 지 알것이다. scikit-learn에는 많은 스케일링 메서드들이 모듈화 되어있는데, 기본적으로 정규화와 표준화가 무엇인지 이해해야 과제를 수 heeya-stupidbutstudying.tistory.com # 통계분석 : 어떤 데이터가 주어졌을 때 데이터 간의 관계를 파악하고 이를 분석하는 것 # 기술통계 : 자료를 정리하고 요약 및 시각화를 하는 기초적인 총계 # 중심경향값 (평균, 중위수, 최빈수), 산포도(분산, 표준편차, 범위, 사분위수), 분포도(왜도, 첨도) # 기초 통계량 계산 함수 약간 보기 mean(1:5..
-
R 기초 17 - 정형 데이터 처리(RDBMS 연동) SQLite, MariaDB 연동R 2022. 10. 24. 17:13
RDBMS 를 사용하기 위해서는 java가 다운되어 있어야된다. 또한 환경변수에 등록해놔야 된다. # 정형 데이터 처리 : RDBMS와 연동 # RJDBC api를 사용 install.packages("rJava") # install install.packages("DBI") # install install.packages("RJDBC") # install # Sys.setenv(JAVA_HOME="c:/자바 설치 경로 입력") 근데 굳이 설정 안 해도 된다. library(rJava) library(DBI) library(RJDBC) # 개인용 DB : Sqlite와 연동 install.packages("RSQLite") library(RSQLite) mtcars # 자동차 정보 dataset 기본용 ..
-
R 기초 16 - 데이터 전처리R 2022. 10. 24. 15:45
데이터 전처리(data preprocessing )가 필요한 이유는 무엇일까. 우수한 예측 분석 결과는 잘 정돈된 데이터에서 출발한다. 즉, 정교한 예측 분석 모델을 얻기 위해서는 수집된 데이터에 누락된 부분이나, 오차, 또는 데이터 처리에 있어서 가공할 부분은 없는지를 살펴보아야 한다. 데이터 전처리 종류? 데이터 전처리의 종류에는 데이터 클리닝(cleaning), 데이터 통합(integration) , 데이터 변환(transformation), 데이터 축(reduction), 데이터 이산화(discretization) 등이 존재한다. 데이터의 결측치 및 이상치를 확인하거나 제거하고 불일치되는 부분을 일관성 있는 데이터의 형태로 전환 하기도 하는 이 전 과정을 데이터의 전처리라고 일컫는다. # 데이터 ..