일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 판다스
- control statement
- 파이썬
- 배열
- 순회 크롤러
- sklearn
- Titanic data set
- dataframe
- pandas
- 제어문
- ML
- 파이썬 크롤러
- 사이킷런
- Machine Learning
- 머신러닝
- python
- 넘파이
- 나이브베이즈
- 파이썬 객체 지향 프로그래밍
- KMeans Clustering
- python control statement
- scikit-learn
- Data pre-processing
- 파이썬 크롤링
- Naive Bayes
- 타이타닉 데이터
- 파이썬 제어문
- K평균군집화
- NumPy
- Python crawler
- Today
- Total
목록dataframe (2)
Try to 개발자 EthanJ의 성장 로그

Pandas Data pre-processing 판다스 데이터 전처리 1. Hierarchical Indexing 계층 색인¶ 행, 열의 각 축에 대해 다중 단계(계층)를 지정하여 데이터에 차원을 설정 index에 다차원 리스트를 전달하면 계층 색인을 지정할 수 있음 데이터 구조를 재배열하거나 pivot 테이블과 같은 group 기반 작업에 유용 재배열 method stack() : column을 row로 pivot unstack() : row를 column으로 pivo In [1]: import pandas as pd import numpy as np 1.1. Series Hierarchical Indexing 시리즈 계층 색인¶ index에 다차원 리스트(아이템 2개)를 전달 다차원리스트[0]: 상위..
Pandas DataFrame 판다스 데이터프레임¶ DataFrame¶ 2차원 배열과 유사한 자료형 다차원 list, dict 자료형으로 데이터 구성 가능 Similar data structure with relational database table, MS excel .xlsx, .csv file 하나의 column = 하나의 Series = 하나의 row 하나의 Dataframe = 한 개 이상의 Series 묶음 index 특징 row index: 행 인덱스: axis=0 RangeIndex int index대신 지정한 label index 사용해도, int index 병행 사용 가능 column index: 열 인덱스: axis=1 지정 label index 사용 시, RangeIndex int ..