본문 바로가기

+ α/판다스 교재_복습

판다스 자료구조 ( Series - 시리즈 )

728x90

● 시리즈 - 1차원

-인덱스(index) : 데이터 값(value) 일대일 대응

- 키(k)와 값(v)이 '{k:v}' 형태로 짝을 이루는 딕셔너리와 비슷한 구조

 

출처 : 판다스 교재

● 시리즈 생성

1) 딕셔너리 -> 시리즈 

dict_data = {'a':1, 'b':2, 'c':3, 'd':4} # 인덱스 : a,b,c,d 
sr = pd.Series(dict_data) # 딕셔너리 형태의 데이터를 Series형태로 변환 후 저장
sr
-------------------------------------------------------------------------------------
a    1
b    2
c    3
d    4
dtype: int64

딕셔너리의 키(k) : 시리즈의 인덱스(index)

딕셔너리의 값(v) : 시리즈의 데이터값(value)

 

 

2) 리스트 -> 시리즈

list_data = ['2019-02-02', 3.14, 'ABC', True] # 인덱스 : 0,1,2,3 
sr2 = pd.Series(list_data) # 리스트 형태의 데이터를 Series형태로 변환 후 저장
sr2
-------------------------------------------------------------------------
0    2019-02-02
1          3.14
2           ABC
3          True
dtype: object

※ 리스트를 시리즈로 변환 시 인덱스 별도 지정하지 않으면 Default로 정수형 위치 인덱스 지정(0,1,2...)

 

 

3) 튜플 -> 시리즈

tup_data = ('영인', '2015-05-01','여',True)
sr3 = pd.Series(tup_data, index = ['이름','생년월일','성별','학생여부'])
sr3
----------------------------------------------------------------------
이름              영인
생년월일    2015-05-01
성별               여
학생여부          True
dtype: object

※  튜플도 마찬가지로 인덱스 별도 지정하지 않으면 Default로 정수형 위치 인덱스 지정(0,1,2...)

여기서는 Series 함수의 index 옵션 에 맞춰 이름 전달 ( 리스트도 가능)

 

인덱스 구조

- 인덱스는 짝을 이루는 데이터 값의 순서와 주소 지정

- 데이터값의 탐색, 정렬, 선택, 결합 가능

 

● 시리즈 클래스의 메서드 2가지(.index, .values)

인덱스 배열 : Series.index
데이터 값 배열 : Series.values

 

 원소 선택

- 원소의 주소역할 하는 인덱스 사용하여 시리즈의 원소 선택

1) 정수형 위치인덱스 : [](대괄호) 안에 위치 나타내는 숫자 입력

2) 인덱스 이름 : [](대괄호)안에 인덱스 이름과 따옴표와 함께 사용

728x90