BACK END/Python

5일(10.11) pandas

라미보 2022. 10. 11. 17:22

 

 

 

 

 

 

💻 13_pandas

💾 Ex01

#_*_coding:utf-8
'''
Created on 2022. 10. 11.

@author: admin
'''


import numpy as np #배열을 만들때 필요함
import pandas as pd #series를 사용하려면 필요한 import

arr = np.array([10,40,30,20])
print('arr:',arr)
print(type(arr))
print()

#Series 는 항상 1차원이다. 객체를 담을 수 있는 1차원 배열과 같은 자료구조
s1 = pd.Series([10,40,30,20])
print('s1:',s1)
'''
앞에있는것은 index, 뒤에있는것은 value
s1: 0    10
1    40
2    30
3    20
dtype: int64
'''
print(type(s1))#<class 'pandas.core.series.Series'> s1은 Series라는 클래스 타입
print(s1.shape, s1.ndim) #(4,) 1 방 4개짜리, 1차원
print('s1.index:',s1.index)
print('s1.values:',s1.values)
print(s1[1]) #1번방에 위치한 값이 나온다.
print()

#index 변경과 추가
s2 = pd.Series([10,40,30,20],['슬기','정국','웬디','슈가']) 
#앞에는 value, 뒤에는 index/ index=['슬기','정국','웬디','슈가'] index 생략가능
print('s2:',s2)
'''
s2: 슬기    10
정국    40
웬디    30
슈가    20
dtype: int64

'''
print(s2['웬디'])#30 , 웬디(index)에 해당되는 value의 값이 나온다
print()
print(s2[['웬디']]) #dtype: int64
print()

s2['슬기'] =70
s2['윤아'] =50
print('s2:',s2) #있던곳에 넣으면 변경이되고, 없는것을 적으면 추가가된다
'''
s2: 슬기    70
정국    40
웬디    30
슈가    20
윤아    70
dtype: int64
'''
print()
print('s2.values:',s2.values <40) #s2.values: [False False  True  True False]
#40보다 작은 것은 true로 나온다.
print(s2[s2.values <40]) #value값이 40미만인 index와 value를 출력한다
'''
웬디    30
슈가    20
dtype: int64
'''
print()
print(s2[['웬디','슈가']]) #index와 value를 가져올때는 대괄호를 하나 더 해준다
'''
웬디    30
슈가    20
dtype: int64
'''
print()
print('s2:',s2)
print('s2*2:',s2*2) #value에 곱하기 2가 된다.
print('정국' in s2) #True s2에 정국이 있으므로 True
print('장동건' in s2) #False s2에 장동건이 없으므로 False
print(s2.shape, s2.ndim)
print('-------------------------------')


from pandas import Series
d = {'서울':2000, '부산':3000, '울산':4000, '광주':5000}
print('d:',d)
print(type(d))
s3 = Series(d)
print('s3:',s3)
'''
s3: 서울    2000
부산    3000
울산    4000
광주    5000
dtype: int64

'''
# key = index , value=value가 된다.
print('s3.index:',s3.index) #s3.index: Index(['서울', '부산', '울산', '광주'], dtype='object')
print('s3.values:',s3.values) #s3.values: [2000 3000 4000 5000]
print()
print('-------------------------------')


city = ['부산','제주','서울','광주']
s4 = Series(d,index=city) #value는 dict d 를 그대로 쓰고, index는 city의 것을 사용한다
print('s4:',s4)
'''
s4: 부산    3000.0
제주       NaN -값이 따로 없을때 NaN으로 나온다. NaN이 하나라도 나오면 숫자 전체가 실수로 나온다.
서울    2000.0
광주    5000.0
dtype: float64
'''

 

import numpy as np #배열을 만들때 필요함
import pandas as pd #series를 사용하려면 필요한 import

arr = np.array([10,40,30,20])
print('arr:',arr)
print(type(arr))
print()

#Series 는 항상 1차원이다. 객체를 담을 수 있는 1차원 배열과 같은 자료구조
s1 = pd.Series([10,40,30,20])
print('s1:',s1)
'''
앞에있는것은 index, 뒤에있는것은 value
s1: 0    10
1    40
2    30
3    20
dtype: int64
'''
print(type(s1))#<class 'pandas.core.series.Series'> s1은 Series라는 클래스 타입
print(s1.shape, s1.ndim) #(4,) 1    방 4개짜리, 1차원
print('s1.index:',s1.index)
print('s1.values:',s1.values)
print(s1[1])   #1번방에 위치한 값이 나온다.
print()

#index 변경과 추가
s2 = pd.Series([10,40,30,20],['슬기','정국','웬디','슈가']) 

 

#앞에는 value, 뒤에는 index/ index=['슬기','정국','웬디','슈가'] index 생략가능

 

print('s2:',s2)
'''
s2: 슬기    10
정국    40
웬디    30
슈가    20
dtype: int64

'''
print(s2['웬디'])   #30 , 웬디(index)에 해당되는 value의 값이 나온다
print()
print(s2[['웬디']])   #dtype: int64
print()

s2['슬기'] =70
s2['윤아'] =50
print('s2:',s2)  # 있던곳에 넣으면 변경이되고, 없는것을 적으면 추가가된다
'''
s2: 슬기    70
정국    40
웬디    30
슈가    20
윤아    70
dtype: int64
'''
print()
print('s2.values:',s2.values <40)   #s2.values: [False False  True  True False]
#40보다 작은 것은 true로 나온다.
print(s2[s2.values <40])  #value값이 40미만인 index와 value를 출력한다
'''
웬디    30
슈가    20
dtype: int64
'''
print()
print(s2[['웬디','슈가']]) #index와 value를 가져올때는 대괄호를 하나 더 해준다
'''
웬디    30
슈가    20
dtype: int64
'''
print()
print('s2:',s2)
print('s2*2:',s2*2) #value에 곱하기 2가 된다.

'''

정국     80
웬디     60
슈가     40
윤아    100

'''


print('정국' in s2) #True s2에 정국이 있으므로 True
print('장동건' in s2) #False s2에 장동건이 없으므로 False
print(s2.shape, s2.ndim)



from pandas import Series
d = {'서울':2000, '부산':3000, '울산':4000, '광주':5000}
print('d:',d)
print(type(d))
s3 = Series(d)
print('s3:',s3)
'''
s3: 서울    2000
부산    3000
울산    4000
광주    5000
dtype: int64

'''
# key = index , value=value가 된다.


print('s3.index:',s3.index) #s3.index: Index(['서울', '부산', '울산', '광주'], dtype='object')
print('s3.values:',s3.values) #s3.values: [2000 3000 4000 5000]
print()
print('-------------------------------')


city = ['부산','제주','서울','광주']
s4 = Series(d,index=city) #value는 dict d 를 그대로 쓰고, index는 city의 것을 사용한다
print('s4:',s4)
'''
s4: 부산    3000.0
제주       NaN -값이 따로 없을때 NaN으로 나온다. NaN이 하나라도 나오면 숫자 전체가 실수로 나온다.
서울    2000.0
광주    5000.0
dtype: float64
'''

'BACK END > Python' 카테고리의 다른 글

6일(10.12) pandas - DataFrame  (0) 2022.10.12
6일(10.12) numpy과제풀이, pandas-Series&DataFrame  (0) 2022.10.12
5일(10.11) numpy 배열  (0) 2022.10.11
5일(10.11) 예외처리과제풀이, DB예외처리  (0) 2022.10.11
4일(10.07) DB  (0) 2022.10.07