R 기초 35 - Clustering(군집분석) - 데이터의 패턴에 따른 분류

R 2022. 10. 28. 11:04

# Clustering(군집분석) - 데이터의 패턴에 따른 분류
# 요소 간의 거리값을 이용해서 군집화

# 계층적 군집분석(탐색적 분석)
# 군집의 갯수를 모르는 상태에서 군집화 됨

x <- c(1,2,2,4,5)
y <- c(1,1,4,3,4)
xy <- data.frame(cbind(x, y))
xy

plot(xy, pch = 20, xlab = 'x값', ylab = 'y값', xlim = c(0,6), ylim = c(0,6))
text(xy[,1],xy[,2], labels = abbreviate(rownames(xy)), cex = 0.8, pos = 1, col = 'blue')

dist(xy, method = "euclidean") ^ 2

# 덴드로그램으로 시각화
hc_sl <- hclust(dist(xy, method = "euclidean") ^ 2, method = "single")
hc_sl
plot(hc_sl)

hc_co <- hclust(dist(xy) ^ 2, method = 'complete')
hc_co
plot(hc_co)


# iris dataset으로 군집화
idist <- dist(iris[, 1:4])
idist

hc <- hclust(idist)
plot(hc, hang = -1)
rect.hclust(hc, k = 3, border = 'red')

# 군집 자르기
ghc <- cutree(hc, k =3)
ghc

iris$ghc <- ghc
head(iris, 3)

g1 <- subset(iris, ghc == 1)
g2 <- subset(iris, ghc == 2)
g3 <- subset(iris, ghc == 3)
NROW(g1)
NROW(g2)
NROW(g3)

summary(g1)
summary(g2)
summary(g3)

'R' 카테고리의 다른 글

R 기초 36 - # 비계층적 군집분석 (0)	2022.10.28
R 기초 34 - 머신러닝의 종류(지도 학습, 비지도 학습, 강화 학습) (0)	2022.10.28
R 기초 33 - 인공신경망 (ANN : Artificial Neural Network) - Perceptron (0)	2022.10.27
R 기초 32 - K-최근접 이웃(K-Nearest Neighbor, KNN) (0)	2022.10.27
R 기초 31 - 서포트 벡터 머신(SVM) (0)	2022.10.27

ABOUT ME

코딩탕탕 코딩탕탕

'R' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'R' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바