#pandas library, Series, DataFrame namespace 불러오기

import pandas as pd


sr_1 = pd.Series(10)

sr_1

0    10
dtype: int64


sr_1[0]

10


sr_1.values

array([10], dtype=int64)


sr_1.index

RangeIndex(start=0, stop=1, step=1)


sr_2 = pd.Series('abc')

sr_2

0    abc
dtype: object


sr_2.values

array(['abc'], dtype=object)


sr_2.index

RangeIndex(start=0, stop=1, step=1)


sr_3 = pd.Series([1, 3, 5])

sr_3

0    1
1    3
2    5
dtype: int64


sr_3.values

array([1, 3, 5], dtype=int64)


sr_3.index

RangeIndex(start=0, stop=3, step=1)


sr_4 = pd.Series([10.3, "test", 2000, [1, 2, 3]])

sr_4

0         10.3
1         test
2         2000
3    [1, 2, 3]
dtype: object


sr_4.values

array([10.3, 'test', 2000, list([1, 2, 3])], dtype=object)


sr_4.index

RangeIndex(start=0, stop=4, step=1)


sr_5 = pd.Series({'a':10, 'b':20, 'c':30})

sr_5

a    10
b    20
c    30
dtype: int64


sr_5.values

array([10, 20, 30], dtype=int64)


sr_5.index

Index(['a', 'b', 'c'], dtype='object')


sr_5[0]

10


sr_5['a']

10


sr_6 = pd.Series((1, 2, 3, 4, 5.0))

sr_6

0    1.0
1    2.0
2    3.0
3    4.0
4    5.0
dtype: float64


sr_6.values

array([1., 2., 3., 4., 5.])


sr_6.index

RangeIndex(start=0, stop=5, step=1)


sr_6.index = (2018, 2019, 2020, 2021, 2022)

sr_6

2018    1.0
2019    2.0
2020    3.0
2021    4.0
2022    5.0
dtype: float64


sr_6.index

Int64Index([2018, 2019, 2020, 2021, 2022], dtype='int64')


sr_6.index[0]

2018


sr_6.index[2] = 1998

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_9864\1859156694.py in <module>
----> 1 sr_6.index[2] = 1998

~\anaconda3\lib\site-packages\pandas\core\indexes\base.py in __setitem__(self, key, value)
   5033     @final
   5034     def __setitem__(self, key, value):
-> 5035         raise TypeError("Index does not support mutable operations")
   5036 
   5037     def __getitem__(self, key):

TypeError: Index does not support mutable operations


sr_6.index = ['q', 'w', 'e', 'r', 't']

sr_6

q    1.0
w    2.0
e    3.0
r    4.0
t    5.0
dtype: float64


sr_7 = pd.Series([10, 20, 30, 40, 50], index=['Mon', 'Tue', 'Wed', 'Thu', 'Fri'])

sr_7

Mon    10
Tue    20
Wed    30
Thu    40
Fri    50
dtype: int64


sr_7.index

Index(['Mon', 'Tue', 'Wed', 'Thu', 'Fri'], dtype='object')


sr_7.values

array([10, 20, 30, 40, 50], dtype=int64)


sr_7[2]

30


sr_7['Wed']

30


my_dict = {'서울':100, '경기':200, '강원':300, '부산':400}
my_sample = pd.Series(my_dict)

print(my_dict)
print(my_sample)

{'서울': 100, '경기': 200, '강원': 300, '부산': 400}
서울    100
경기    200
강원    300
부산    400
dtype: int64


print('서울' in my_dict)

print('강원' in my_sample)

True
True


for item in my_dict:
    print(item)
    
print('=' * 10)

for value in my_sample.values:
    print(value)

서울
경기
강원
부산
==========
100
200
300
400


new_index = ['서울', '강원', '경기', '제주']

new_sample = pd.Series(my_dict, index=new_index)
new_sample

서울    100.0
강원    300.0
경기    200.0
제주      NaN
dtype: float64


my_dict

{'서울': 100, '경기': 200, '강원': 300, '부산': 400}


my_data = {'a':10, 'b':20, 'c':30}
sr_6 = pd.Series(my_data)

sr_6

a    10
b    20
c    30
dtype: int64


print(sr_6.index[0])

print(sr_6[0])

a
10


sr_6['a']

10


sr_7

Mon    10
Tue    20
Wed    30
Thu    40
Fri    50
dtype: int64


sr_7.index['Mon']

---------------------------------------------------------------------------
IndexError                                Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_9864\963837586.py in <module>
----> 1 sr_7.index['Mon']

~\anaconda3\lib\site-packages\pandas\core\indexes\base.py in __getitem__(self, key)
   5067             key = np.asarray(key, dtype=bool)
   5068 
-> 5069         result = getitem(key)
   5070         # Because we ruled out integer above, we always get an arraylike here
   5071         if result.ndim > 1:

IndexError: only integers, slices (`:`), ellipsis (`...`), numpy.newaxis (`None`) and integer or boolean arrays are valid indices


print(sr_7['Tue'])

sr_7['Tue'] = 200
sr_7

20

Mon     10
Tue    200
Wed     30
Thu     40
Fri     50
dtype: int64


print(sr_7[0])

sr_7[0] = 100
sr_7

10

Mon    100
Tue    200
Wed     30
Thu     40
Fri     50
dtype: int64


sr_7[['Mon', 'Thu']]

Mon    100
Thu     40
dtype: int64


sr_7[('Mon', 'Thu')]

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_9864\3856407577.py in <module>
----> 1 sr_7[('Mon', 'Thu')]

~\anaconda3\lib\site-packages\pandas\core\series.py in __getitem__(self, key)
    982             return self._get_values(key)
    983 
--> 984         return self._get_with(key)
    985 
    986     def _get_with(self, key):

~\anaconda3\lib\site-packages\pandas\core\series.py in _get_with(self, key)
    997             )
    998         elif isinstance(key, tuple):
--> 999             return self._get_values_tuple(key)
   1000 
   1001         elif not is_list_like(key):

~\anaconda3\lib\site-packages\pandas\core\series.py in _get_values_tuple(self, key)
   1032 
   1033         if not isinstance(self.index, MultiIndex):
-> 1034             raise KeyError("key of type tuple not found and not a MultiIndex")
   1035 
   1036         # If key is contained, would have returned by now

KeyError: 'key of type tuple not found and not a MultiIndex'


sr_en = pd.Series([10, 20, 30, 40, 50], index=list('abcde'))

sr_en

a    10
b    20
c    30
d    40
e    50
dtype: int64


# RangeIndex: 0 ~ 1
sr_en[0:2]

a    10
b    20
dtype: int64


# label index: 'a' ~ 'c'
sr_en['a':'c']

a    10
b    20
c    30
dtype: int64


# RangeIndex int index + step
sr_en[0:5:2]

a    10
c    30
e    50
dtype: int64


# label index + step
sr_en['b':'d':2]

b    20
d    40
dtype: int64


sr_int = pd.Series([10, -3, -31, 34, -35, 14, -61, 12, 0])

sr_int

0    10
1    -3
2   -31
3    34
4   -35
5    14
6   -61
7    12
8     0
dtype: int64


sr_int < 0

0    False
1     True
2     True
3    False
4     True
5    False
6     True
7    False
8    False
dtype: bool


sr_int[sr_int < 0]

1    -3
2   -31
4   -35
6   -61
dtype: int64


sr_int[(sr_int > 10) & (sr_int < 40)]

3    34
5    14
7    12
dtype: int64


sr_1 = pd.Series([1, 2, 3, 4], index=list('abcd'))

sr_2 = pd.Series([10, 20, 30, 40, 50, 60], index=list('acdefg'))


sr_1

a    1
b    2
c    3
d    4
dtype: int64


sr_2

a    10
c    20
d    30
e    40
f    50
g    60
dtype: int64


sr_2 * 3

a     30
c     60
d     90
e    120
f    150
g    180
dtype: int64


sr_1 + sr_2

a    11.0
b     NaN
c    23.0
d    34.0
e     NaN
f     NaN
g     NaN
dtype: float64


sr_1.add(sr_2, fill_value=0)

a    11.0
b     2.0
c    23.0
d    34.0
e    40.0
f    50.0
g    60.0
dtype: float64


sr_1.add(sr_2, fill_value=100)

a     11.0
b    102.0
c     23.0
d     34.0
e    140.0
f    150.0
g    160.0
dtype: float64


sr_1.sub(sr_2)

a    -9.0
b     NaN
c   -17.0
d   -26.0
e     NaN
f     NaN
g     NaN
dtype: float64


sr_1.sub(sr_2, fill_value=0)

a    -9.0
b     2.0
c   -17.0
d   -26.0
e   -40.0
f   -50.0
g   -60.0
dtype: float64


sr_1.mul(sr_2)

a     10.0
b      NaN
c     60.0
d    120.0
e      NaN
f      NaN
g      NaN
dtype: float64


sr_1 * sr_2

a     10.0
b      NaN
c     60.0
d    120.0
e      NaN
f      NaN
g      NaN
dtype: float64


sr_1.mul(sr_2, fill_value=1)

a     10.0
b      2.0
c     60.0
d    120.0
e     40.0
f     50.0
g     60.0
dtype: float64


sr_1 / sr_2

a    0.100000
b         NaN
c    0.150000
d    0.133333
e         NaN
f         NaN
g         NaN
dtype: float64


sr_1.div(sr_2)

a    0.100000
b         NaN
c    0.150000
d    0.133333
e         NaN
f         NaN
g         NaN
dtype: float64


sr_1.div(sr_2, fill_value=1)

a    0.100000
b    2.000000
c    0.150000
d    0.133333
e    0.025000
f    0.020000
g    0.016667
dtype: float64


import numpy as np

arr_data = np.random.randint(1, 100, size=26)
sr_data = pd.Series(arr_data, index=list('abcdefghijklmnopqrstuvwxyz'))

sr_data

a    78
b    75
c    46
d    43
e    53
f    73
g    23
h    84
i    48
j    79
k     5
l    71
m    27
n    38
o    24
p    50
q    99
r    39
s    22
t    13
u    61
v    84
w    45
x    57
y    66
z    14
dtype: int32


sr_data['k']

5


sr_data[['a', 'f', 'c']]

a    78
f    73
c    46
dtype: int32


sr_data[5:16]

f    73
g    23
h    84
i    48
j    79
k     5
l    71
m    27
n    38
o    24
p    50
dtype: int32


sr_data[-5:]

v    84
w    45
x    57
y    66
z    14
dtype: int32


sr_data.size

26


len(sr_data)

26


sr_data[sr_data > sr_data.values.mean()]

a    78
b    75
e    53
f    73
h    84
j    79
l    71
q    99
u    61
v    84
x    57
y    66
dtype: int32


sr_data[sr_data > sr_data.mean()]

a    78
b    75
e    53
f    73
h    84
j    79
l    71
q    99
u    61
v    84
x    57
y    66
dtype: int32


50 in sr_data.values

True

Pandas Data Loading 판다스 데이터 적재 (0)	2022.11.05
Pandas DataFrame 판다스 데이터프레임 (0)	2022.11.05
Numpy array Manipulation 넘파이 배열 변형 (0)	2022.11.02
Numpy Operation 넘파이 연산 (0)	2022.10.30
Basic Numpy 넘파이 기초 (0)	2022.10.24

Try to 개발자 EthanJ의 성장 로그

Try to 개발자 EthanJ의 성장 로그

Pandas Series 판다스 시리즈 본문

Pandas Series 판다스 시리즈

Pandas Series 판다스 시리즈¶

Pandas¶

Series¶

1. Series 생성¶

1. Series 속성¶

3. `dict`와 `Series`의 유사성¶

4. 인덱싱(indexing)¶

5. 슬라이싱 (Slicing)¶

6. 조건 색인(Boolean Indexing)¶

7. Operation with scalar value, Series object¶

> 연습 문제¶

'CS & DS > Numpy & Pandas' 카테고리의 다른 글

티스토리툴바

« 2026/04 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

Try to 개발자 EthanJ의 성장 로그

Pandas Series 판다스 시리즈 본문

Pandas Series 판다스 시리즈

Pandas Series 판다스 시리즈¶

Pandas¶

Series¶

1. Series 생성¶

1. Series 속성¶

3. dict와 Series의 유사성¶

4. 인덱싱(indexing)¶

5. 슬라이싱 (Slicing)¶

6. 조건 색인(Boolean Indexing)¶

7. Operation with scalar value, Series object¶

> 연습 문제¶

'CS & DS > Numpy & Pandas' 카테고리의 다른 글

티스토리툴바

3. `dict`와 `Series`의 유사성¶