-
R 기초 12 - 평균값, 중앙값, 최빈값, 분산, 표준편차R 2022. 10. 24. 11:20
평균값 = 변량 전체의 합을 총 개수로 나눈 값이다.
중앙값 = 말 그대로 중앙에 있는 값이다.(2, 3, 4, 5, 6, 7, 8, 9 중의 5를 말한다.)
최빈값 = 가장 많이 관측되는 수, 즉 주어진 값 중에서 가장 자주 나오는 값이다.(1, 3, 6, 6, 6, 7, 7, 12, 12, 17의 최빈값은 6이다. )
분산 = 관측값에서 산술평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 갯수로 나눠서 구한다.
모분산(population variance) = 관측값에서 모 평균을 빼고 그것을 제곱한 값을 모두 더하여 전체 데이터 수 n으로 나눈 것이다.(Python)
표본 분산(sample variance) = 관측값에서 표본 평균을 빼고 제곱한 값을 모두 더한 것을 로 나눈 것이다.(R)
표준편차 = 분산의 제곱근으로 정의한다.
'R' 카테고리의 다른 글
R 기초 14 - 웹(멜론)에서 가사 불러오기(웹을 이용한 데이터 가져오기) XML, json (0) 2022.10.24 R 기초 13 - 내장함수(최소값, 평균값, 분산... 등), 사용자 정의 함수 (0) 2022.10.24 R 기초 11 - 반복문(for, while, repeat) (0) 2022.10.24 R 기초 10 - switch, which (0) 2022.10.24 R 기초 9 - 연산자, if 조건문 (0) 2022.10.24