Python 데이터 분석
-
konlpy 설치Python 데이터 분석 2022. 11. 3. 12:09
KoNLPy(“코엔엘파이”라고 읽는다)는 한국어 정보처리를 위한 파이썬 패키지이다. Daum 카페 cafe.daum.net 위의 카페를 참조해서 다운로드 받는다. konlpy 라이브러리는 자바로 만들었기 때문에 설치하기 전 자바가 깔려있어야 된다. pip install --upgrade pip(파이썬 패키지 업그레이드 명령어) pip install JPype1(자바로 만들었기 때문에 konlpy를 install하기 전 자바 파이썬을 install 해준다.) pip install konlpy(konlpy install)
-
Python 데이터분석 기초 23 - Django에서의 DataFrame, crosstab, 시각화Python 데이터 분석 2022. 11. 3. 11:32
models.py from django.db import models # Create your models here. class Jikwon(models.Model): jikwon_no = models.IntegerField(primary_key=True) jikwon_name = models.CharField(max_length=10) buser_num = models.IntegerField() jikwon_jik = models.CharField(max_length=10, blank=True, null=True) jikwon_pay = models.IntegerField(blank=True, null=True) jikwon_ibsail = models.DateField(blank=True, null=..
-
DB 데이터 불러와서 시각화 예제Python 데이터 분석 2022. 11. 2. 18:05
작성자 코드(A 5번 못 풀음... ㅠ) import MySQLdb import numpy as np import pandas as pd import matplotlib.pyplot as plt from conda.common._logic import FALSE from matplotlib.pyplot import xlabel plt.rc('font', family='malgun gothic') plt.rcParams['axes.unicode_minus'] = False import pickle import csv try: with open('mydb.dat', mode='rb') as obj: config=pickle.load(obj) except Exception as e: print('connect..
-
Python 데이터분석 기초 22 - 원격 DB와 연동 후 DataFrame으로 처리, 시각Python 데이터 분석 2022. 11. 2. 17:56
''' 원격 DB와 연동 후 DataFrame으로 처리 ''' import MySQLdb import numpy as np import pandas as pd import matplotlib.pyplot as plt from conda.common._logic import FALSE plt.rc('font', family='malgun gothic') plt.rcParams['axes.unicode_minus'] = False import pickle import csv try: with open('mydb.dat', mode='rb') as obj: config=pickle.load(obj) except Exception as e: print('connect err : ', e) try: conn=My..
-
Python 데이터분석 기초 21 - local DB와 pandas(sqlite에 DataFrame 넣기)Python 데이터 분석 2022. 11. 2. 15:15
#local DB와 pandas import sqlite3 import pandas as pd sql="create table if not exists test(product varchar(10), maker varchar(10), weight real, price integer)" conn=sqlite3.connect(':memory:') #db 안만들고 휘발성 메모리에서 하는 것 #conn=sqlite3.connect('mydb') , db 만들어서 하기 conn.execute(sql) conn.commit() datas=[('mouse','samsong', 12.5, 5000),('keyboard','alg', 50.5, 35000)] stmt="insert into test values(?,?,?..
-
Python 데이터분석 기초 20 - 자전거 공유 시스템 시각화(web에서 데이터 가져옴), null 값이 있는 지에 대한 시각화, 칼럼 추가Python 데이터 분석 2022. 11. 2. 13:24
# 자전거 공유 시스템 분석용 # : kaggle 사이트의 Bike Sharing in Washington D.C. Dataset를 편의상 조금 변경한 dataset을 사용함 # # columns : # 'datetime', # 'season'(사계절:1,2,3,4), # 'holiday'(공휴일(1)과 평일(0)), # 'workingday'(근무일(1)과 비근무일(0)), # 'weather'(4종류:Clear(1), Mist(2), Snow or Rain(3), Heavy Rain(4)), # 'temp'(섭씨온도), 'atemp'(체감온도), # 'humidity'(습도), 'windspeed'(풍속), # 'casual'(비회원 대여량), 'registered'(회원 대여량), # 'count'..
-
Python 데이터분석 기초 19 - yahoo 주식 데이터 시각화(파일 있을 경우)Python 데이터 분석 2022. 11. 2. 13:20
# yahoo 제공 주식 정보 읽기 # pip install pandas_datareader 설치 import pandas as pd from pandas_datareader import data # pickle로 저장된 코스닥/코스피 종목 코드 읽기 kosdaq = pd.read_pickle('./kosdaq.pickle') kospi = pd.read_pickle('./kospi.pickle') print(kosdaq.head(5)) # 제일홀딩스 003380 print(kospi.head(5)) # 넷마블게임즈 251270 print() start_date = '2018-01-01' tickers = ['003380.KQ', '251270.KS'] holding_df = data.get_data_y..
-
Python 데이터분석 기초 18 - 차트의 종류Python 데이터 분석 2022. 11. 2. 12:17
# 차트의 종류 경험하기 : data의 성격에 따라 차트를 적용하는 것이 중요함. import numpy as np import matplotlib.pyplot as plt # 차트 영역 객체 선언시 matplotlib 스타일 관련 인터페이스 유형 # x = np.arange(10) # # # 방법1 : matplotlib 스타일 # plt.figure() # plt.subplot(2, 1, 1) # row, column, panel number(active) # plt.plot(x, np.sin(x)) # plt.subplot(2, 1, 2) # plt.plot(x, np.cos(x)) # plt.show() # # # 방법2 : 객체지향 인터페이스 # fig, ax = plt.subplots(2, 1..