-
Python 데이터분석 기초 1 - Numpy(합, 평균, 분산, 표준편차)Python 데이터 분석 2022. 10. 28. 13:00
# Numpy는 C언어로 구현된 파이썬 라이브러리로써, 고성능의 수치계산과 선형대수학을 위해 제작되었다. # Numerical Python의 줄임말이기도 한 Numpy는 벡터 및 행렬 연산에 있어서 매우 편리한 기능을 제공한다. grades = [1, 3, -2, 4] # 변량 def grades_sum(grades): # 합을 구하는 함수 tot = 0 for g in grades: tot += g return tot def grades_avg(grades): # 평균값을 구하는 함수 tot = grades_sum(grades) ave = tot / len(grades) return ave def grades_variance(grades): # 편차제곱의 평균 : 분산 ave = grades_avg(grades) vari = 0 for su in grades: vari += (su - ave) ** 2 # 요소 - 평균값 제곱근은 ** 이다 return vari / len(grades) # 평균값 / 요소갯수(파이썬 방법) # return vari / (len(grades) - 1) # R은 자유도를 사용한다. def grades_std(grades): return grades_variance(grades) ** 0.5 # 루트는 ** 0.5이다. print('합은', grades_sum(grades)) print('평균은', grades_avg(grades)) print('분산은', grades_variance(grades)) print('표준편차는', grades_std(grades)) print('numpy 함수 사용') import numpy print('합은', numpy.sum(grades)) print('평균은', numpy.mean(grades)) print('분산은', numpy.var(grades)) print('표준편차는', numpy.std(grades)) <console> 합은 6 평균은 1.5 분산은 5.25 표준편차는 2.29128784747792 numpy 함수 사용 합은 6 평균은 1.5 분산은 5.25 표준편차는 2.29128784747792
Numpy는 고성능의 수치계산과 선형대수학을 위해 제작된 라이브러리이다. 이것을 사용하면 위처럼 함수를 만들지 않아도 사용하기 편리하다.
제곱근 = ** 2
루트 = ** 0.5
R에서는 분산을 구할 때 요소갯수 - 1(자유도)로 나누지만 Python에서는 요소갯수로 나눈다.
'Python 데이터 분석' 카테고리의 다른 글
Python 데이터분석 기초 6 - Pandas(Series) 2차원, 배열 (0) 2022.10.31 Python 데이터분석 기초 5 - 배열에서 조건 연산 where(조건, 참, 거짓) 3항 연산자, 배열 결합, 복원/비복원 (0) 2022.10.28 Python 데이터분석 기초 4 - 배열에 행/열 추가, append, insert, delete (0) 2022.10.28 Python 데이터분석 기초 3 - 배열 연산, 벡터 간 내적 연산, 파일 저장, 불러오기 (0) 2022.10.28 Python 데이터분석 기초 2 - Numpy(배열), list vs Numpy (0) 2022.10.28