R

R 기초 12 - 평균값, 중앙값, 최빈값, 분산, 표준편차

코딩탕탕 2022. 10. 24. 11:20

 

평균값 = 변량 전체의 합을 총 개수로 나눈 값이다.

중앙값 = 말 그대로 중앙에 있는 값이다.(2, 3, 4, 5, 6, 7, 8, 9 중의 5를 말한다.)

최빈값 = 가장 많이 관측되는 수, 즉 주어진 값 중에서 가장 자주 나오는 값이다.(1, 3, 6, 6, 6, 7, 7, 12, 12, 17의 최빈값은 6이다. )

분산 = 관측값에서 산술평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구한다.

모분산(population variance) = 관측값에서 모 평균을 빼고 그것을 제곱한 값을 모두 더하여 전체 데이터 수 n으로 나눈 것이다.(Python)

표본 분산(sample variance) = 관측값에서 표본 평균을 빼고 제곱한 값을 모두 더한 것을 로 나눈 것이다.(R)

표준편차 = 분산의 제곱근으로 정의한다.