ABOUT ME

초보 개발자의 코딩 노트( 코딩탕탕)

Today
Yesterday
Total
  • Python 데이터분석 기초 15 - df 자료로 슬라이싱(iloc, loc), 문자열을 int 타입으로 형변환
    Python 데이터 분석 2022. 11. 1. 17:36

     

    print('----df 자료로 슬라이싱...----')
    print('iloc')# iloc
    print(df.iloc[0]) # 1차원 배열 취급
    
    print(df.iloc[0:2, :])   # 0행부터 2행 전까지 모든 열, 2차원 배열 취급
    print(df.iloc[0:2, 0:1]) # 0행부터 2행 전까지 0열
    print(df.iloc[0:2, 0:2]) # 0행부터 2행 전까지 1열까지
    print()
    print(df['지역'][0:2])     # 지역 칼럼의 0행과 1행
    print()
    print(df['지역'][:2])      # 지역 칼럼의 0행과 1행
    
    print()
    print('loc') # loc
    print(df.loc[1:3])   # 1행부터 3행
    print(df[1:4])       # 1행부터 3행
    print(df.loc[[1,3]]) # 1행과 3행만 호출
    print(df.loc[:, '지역'].head(2)) # 지역 열의 1행까지
    print(df.loc[1:3, ['최저기온','지역']]) # 1,2,3행의 최저기온과 지역 열 호출
    print(df.loc[:, '지역'][1:4]) # 전체 지역의 열 호출
    
    print('-----')
    df = df.astype({'최저기온':int}) # 최저기온 열을 int 타입으로 형변환
    print(df.info())
    print(df['최저기온'].mean(), ' ', df['최저기온'].std()) # 평균, 표준편차 구하기
    
    print(df['최저기온'] >= 6) # true, false 반환
    
    print(df.loc[df['최저기온'] >= 7])
    
    print(df.sort_values(['최저기온'], ascending = True)) # 추운 순서대로 호출
    
    <console>
    ----df 자료로 슬라이싱...----
    iloc
    지역      서울
    최저기온     1
    Name: 0, dtype: object
       지역 최저기온
    0  서울    1
    1  인천    2
       지역
    0  서울
    1  인천
       지역 최저기온
    0  서울    1
    1  인천    2
    
    0    서울
    1    인천
    Name: 지역, dtype: object
    
    0    서울
    1    인천
    Name: 지역, dtype: object
    
    loc
       지역 최저기온
    1  인천    2
    2  수원    1
    3  파주   -3
       지역 최저기온
    1  인천    2
    2  수원    1
    3  파주   -3
       지역 최저기온
    1  인천    2
    3  파주   -3
    0    서울
    1    인천
    Name: 지역, dtype: object
      최저기온  지역
    1    2  인천
    2    1  수원
    3   -3  파주
    1    인천
    2    수원
    3    파주
    Name: 지역, dtype: object
    -----
    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 41 entries, 0 to 40
    Data columns (total 2 columns):
     #   Column  Non-Null Count  Dtype 
    ---  ------  --------------  ----- 
     0   지역      41 non-null     object
     1   최저기온    41 non-null     int32 
    dtypes: int32(1), object(1)
    memory usage: 620.0+ bytes
    None
    4.170731707317073   3.6118031440292406
    0     False
    1     False
    2     False
    3     False
    4     False
    5     False
    6     False
    7     False
    8     False
    9     False
    10    False
    11    False
    12    False
    13    False
    14    False
    15     True
    16     True
    17     True
    18     True
    19     True
    20    False
    21    False
    22    False
    23    False
    24    False
    25    False
    26    False
    27     True
    28     True
    29     True
    30     True
    31    False
    32     True
    33    False
    34    False
    35     True
    36    False
    37    False
    38     True
    39     True
    40     True
    Name: 최저기온, dtype: bool
         지역  최저기온
    16   목포     8
    17   여수     9
    18   순천     7
    19   광양     7
    27   부산     9
    28   울산     7
    29   창원     8
    32   통영     9
    35   포항     7
    38  울릉도     9
    39   제주    12
    40  서귀포    12
         지역  최저기온
    3    파주    -3
    4    이천    -1
    26   무주     0
    14   영동     0
    6    춘천     0
    13   충주     0
    0    서울     1
    31   거창     1
    11   홍성     1
    10   세종     1
    7    원주     1
    5    평택     1
    2    수원     1
    34   안동     2
    1    인천     2
    9    대전     2
    12   청주     3
    24   남원     3
    23   정읍     4
    36   경주     4
    22   군산     4
    20   나주     4
    21   전주     4
    25   고창     5
    8    강릉     5
    37   울진     5
    33   대구     5
    30   진주     6
    15   광주     6
    19   광양     7
    18   순천     7
    35   포항     7
    28   울산     7
    16   목포     8
    29   창원     8
    27   부산     9
    17   여수     9
    32   통영     9
    38  울릉도     9
    39   제주    12
    40  서귀포    12

     

     

    댓글

Designed by Tistory.