R
R 기초 12 - 평균값, 중앙값, 최빈값, 분산, 표준편차
코딩탕탕
2022. 10. 24. 11:20
평균값 = 변량 전체의 합을 총 개수로 나눈 값이다.
중앙값 = 말 그대로 중앙에 있는 값이다.(2, 3, 4, 5, 6, 7, 8, 9 중의 5를 말한다.)
최빈값 = 가장 많이 관측되는 수, 즉 주어진 값 중에서 가장 자주 나오는 값이다.(1, 3, 6, 6, 6, 7, 7, 12, 12, 17의 최빈값은 6이다. )
분산 = 관측값에서 산술평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구한다.
모분산(population variance) = 관측값에서 모 평균을 빼고 그것을 제곱한 값을 모두 더하여 전체 데이터 수 n으로 나눈 것이다.(Python)
표본 분산(sample variance) = 관측값에서 표본 평균을 빼고 제곱한 값을 모두 더한 것을 로 나눈 것이다.(R)
표준편차 = 분산의 제곱근으로 정의한다.