💻 13_pandas
💾 Ex01
#_*_coding:utf-8
'''
Created on 2022. 10. 11.
@author: admin
'''
import numpy as np #배열을 만들때 필요함
import pandas as pd #series를 사용하려면 필요한 import
arr = np.array([10,40,30,20])
print('arr:',arr)
print(type(arr))
print()
#Series 는 항상 1차원이다. 객체를 담을 수 있는 1차원 배열과 같은 자료구조
s1 = pd.Series([10,40,30,20])
print('s1:',s1)
'''
앞에있는것은 index, 뒤에있는것은 value
s1: 0 10
1 40
2 30
3 20
dtype: int64
'''
print(type(s1))#<class 'pandas.core.series.Series'> s1은 Series라는 클래스 타입
print(s1.shape, s1.ndim) #(4,) 1 방 4개짜리, 1차원
print('s1.index:',s1.index)
print('s1.values:',s1.values)
print(s1[1]) #1번방에 위치한 값이 나온다.
print()
#index 변경과 추가
s2 = pd.Series([10,40,30,20],['슬기','정국','웬디','슈가'])
#앞에는 value, 뒤에는 index/ index=['슬기','정국','웬디','슈가'] index 생략가능
print('s2:',s2)
'''
s2: 슬기 10
정국 40
웬디 30
슈가 20
dtype: int64
'''
print(s2['웬디'])#30 , 웬디(index)에 해당되는 value의 값이 나온다
print()
print(s2[['웬디']]) #dtype: int64
print()
s2['슬기'] =70
s2['윤아'] =50
print('s2:',s2) #있던곳에 넣으면 변경이되고, 없는것을 적으면 추가가된다
'''
s2: 슬기 70
정국 40
웬디 30
슈가 20
윤아 70
dtype: int64
'''
print()
print('s2.values:',s2.values <40) #s2.values: [False False True True False]
#40보다 작은 것은 true로 나온다.
print(s2[s2.values <40]) #value값이 40미만인 index와 value를 출력한다
'''
웬디 30
슈가 20
dtype: int64
'''
print()
print(s2[['웬디','슈가']]) #index와 value를 가져올때는 대괄호를 하나 더 해준다
'''
웬디 30
슈가 20
dtype: int64
'''
print()
print('s2:',s2)
print('s2*2:',s2*2) #value에 곱하기 2가 된다.
print('정국' in s2) #True s2에 정국이 있으므로 True
print('장동건' in s2) #False s2에 장동건이 없으므로 False
print(s2.shape, s2.ndim)
print('-------------------------------')
from pandas import Series
d = {'서울':2000, '부산':3000, '울산':4000, '광주':5000}
print('d:',d)
print(type(d))
s3 = Series(d)
print('s3:',s3)
'''
s3: 서울 2000
부산 3000
울산 4000
광주 5000
dtype: int64
'''
# key = index , value=value가 된다.
print('s3.index:',s3.index) #s3.index: Index(['서울', '부산', '울산', '광주'], dtype='object')
print('s3.values:',s3.values) #s3.values: [2000 3000 4000 5000]
print()
print('-------------------------------')
city = ['부산','제주','서울','광주']
s4 = Series(d,index=city) #value는 dict d 를 그대로 쓰고, index는 city의 것을 사용한다
print('s4:',s4)
'''
s4: 부산 3000.0
제주 NaN -값이 따로 없을때 NaN으로 나온다. NaN이 하나라도 나오면 숫자 전체가 실수로 나온다.
서울 2000.0
광주 5000.0
dtype: float64
'''
import numpy as np #배열을 만들때 필요함
import pandas as pd #series를 사용하려면 필요한 import
arr = np.array([10,40,30,20])
print('arr:',arr)
print(type(arr))
print()
#Series 는 항상 1차원이다. 객체를 담을 수 있는 1차원 배열과 같은 자료구조
s1 = pd.Series([10,40,30,20])
print('s1:',s1)
'''
앞에있는것은 index, 뒤에있는것은 value
s1: 0 10
1 40
2 30
3 20
dtype: int64
'''
print(type(s1))#<class 'pandas.core.series.Series'> s1은 Series라는 클래스 타입
print(s1.shape, s1.ndim) #(4,) 1 방 4개짜리, 1차원
print('s1.index:',s1.index)
print('s1.values:',s1.values)
print(s1[1]) #1번방에 위치한 값이 나온다.
print()
#index 변경과 추가
s2 = pd.Series([10,40,30,20],['슬기','정국','웬디','슈가'])
#앞에는 value, 뒤에는 index/ index=['슬기','정국','웬디','슈가'] index 생략가능
print('s2:',s2)
'''
s2: 슬기 10
정국 40
웬디 30
슈가 20
dtype: int64
'''
print(s2['웬디']) #30 , 웬디(index)에 해당되는 value의 값이 나온다
print()
print(s2[['웬디']]) #dtype: int64
print()
s2['슬기'] =70
s2['윤아'] =50
print('s2:',s2) # 있던곳에 넣으면 변경이되고, 없는것을 적으면 추가가된다
'''
s2: 슬기 70
정국 40
웬디 30
슈가 20
윤아 70
dtype: int64
'''
print()
print('s2.values:',s2.values <40) #s2.values: [False False True True False]
#40보다 작은 것은 true로 나온다.
print(s2[s2.values <40]) #value값이 40미만인 index와 value를 출력한다
'''
웬디 30
슈가 20
dtype: int64
'''
print()
print(s2[['웬디','슈가']]) #index와 value를 가져올때는 대괄호를 하나 더 해준다
'''
웬디 30
슈가 20
dtype: int64
'''
print()
print('s2:',s2)
print('s2*2:',s2*2) #value에 곱하기 2가 된다.
'''
정국 80
웬디 60
슈가 40
윤아 100
'''
print('정국' in s2) #True s2에 정국이 있으므로 True
print('장동건' in s2) #False s2에 장동건이 없으므로 False
print(s2.shape, s2.ndim)
from pandas import Series
d = {'서울':2000, '부산':3000, '울산':4000, '광주':5000}
print('d:',d)
print(type(d))
s3 = Series(d)
print('s3:',s3)
'''
s3: 서울 2000
부산 3000
울산 4000
광주 5000
dtype: int64
'''
# key = index , value=value가 된다.
print('s3.index:',s3.index) #s3.index: Index(['서울', '부산', '울산', '광주'], dtype='object')
print('s3.values:',s3.values) #s3.values: [2000 3000 4000 5000]
print()
print('-------------------------------')
city = ['부산','제주','서울','광주']
s4 = Series(d,index=city) #value는 dict d 를 그대로 쓰고, index는 city의 것을 사용한다
print('s4:',s4)
'''
s4: 부산 3000.0
제주 NaN -값이 따로 없을때 NaN으로 나온다. NaN이 하나라도 나오면 숫자 전체가 실수로 나온다.
서울 2000.0
광주 5000.0
dtype: float64
'''
'BACK END > Python' 카테고리의 다른 글
6일(10.12) pandas - DataFrame (0) | 2022.10.12 |
---|---|
6일(10.12) numpy과제풀이, pandas-Series&DataFrame (0) | 2022.10.12 |
5일(10.11) numpy 배열 (0) | 2022.10.11 |
5일(10.11) 예외처리과제풀이, DB예외처리 (0) | 2022.10.11 |
4일(10.07) DB (0) | 2022.10.07 |