Python 데이터분석 기초 1 - Numpy(합, 평균, 분산, 표준편차)

Python 데이터 분석 2022. 10. 28. 13:00

# Numpy는 C언어로 구현된 파이썬 라이브러리로써, 고성능의 수치계산과 선형대수학을 위해 제작되었다.
# Numerical Python의 줄임말이기도 한 Numpy는 벡터 및 행렬 연산에 있어서 매우 편리한 기능을 제공한다.

grades = [1, 3, -2, 4] # 변량

def grades_sum(grades): # 합을 구하는 함수
    tot = 0
    for g in grades:
        tot += g
    return tot

def grades_avg(grades): # 평균값을 구하는 함수
    tot = grades_sum(grades)
    ave = tot / len(grades)
    return ave

def grades_variance(grades): # 편차제곱의 평균 : 분산
    ave = grades_avg(grades)
    vari = 0
    for su in grades:
        vari += (su - ave) ** 2 # 요소 - 평균값  제곱근은 ** 이다
    return vari / len(grades)   # 평균값 / 요소갯수(파이썬 방법)
    # return vari / (len(grades) - 1) # R은 자유도를 사용한다.

def grades_std(grades):
    return grades_variance(grades) ** 0.5 # 루트는 ** 0.5이다.

print('합은', grades_sum(grades))
print('평균은', grades_avg(grades))
print('분산은', grades_variance(grades))
print('표준편차는', grades_std(grades))

print('numpy 함수 사용')

import numpy

print('합은', numpy.sum(grades))
print('평균은', numpy.mean(grades))
print('분산은', numpy.var(grades))
print('표준편차는', numpy.std(grades))

<console>
합은 6
평균은 1.5
분산은 5.25
표준편차는 2.29128784747792
numpy 함수 사용
합은 6
평균은 1.5
분산은 5.25
표준편차는 2.29128784747792

Numpy는 고성능의 수치계산과 선형대수학을 위해 제작된 라이브러리이다. 이것을 사용하면 위처럼 함수를 만들지 않아도 사용하기 편리하다.

제곱근 = ** 2

루트 = ** 0.5

R에서는 분산을 구할 때 요소갯수 - 1(자유도)로 나누지만 Python에서는 요소갯수로 나눈다.

'Python 데이터 분석' 카테고리의 다른 글

Python 데이터분석 기초 6 - Pandas(Series) 2차원, 배열 (0)	2022.10.31
Python 데이터분석 기초 5 - 배열에서 조건 연산 where(조건, 참, 거짓) 3항 연산자, 배열 결합, 복원/비복원 (0)	2022.10.28
Python 데이터분석 기초 4 - 배열에 행/열 추가, append, insert, delete (0)	2022.10.28
Python 데이터분석 기초 3 - 배열 연산, 벡터 간 내적 연산, 파일 저장, 불러오기 (0)	2022.10.28
Python 데이터분석 기초 2 - Numpy(배열), list vs Numpy (0)	2022.10.28

ABOUT ME

코딩탕탕 코딩탕탕

'Python 데이터 분석' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'Python 데이터 분석' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바