일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 사이킷런
- python
- 타이타닉 데이터
- KMeans Clustering
- 배열
- Titanic data set
- python control statement
- 파이썬 크롤링
- Python crawler
- 넘파이
- 파이썬 객체 지향 프로그래밍
- pandas
- 파이썬 제어문
- 머신러닝
- Naive Bayes
- NumPy
- control statement
- 판다스
- dataframe
- 순회 크롤러
- Data pre-processing
- Machine Learning
- K평균군집화
- 제어문
- 파이썬
- 나이브베이즈
- scikit-learn
- ML
- 파이썬 크롤러
- sklearn
- Today
- Total
목록Data pre-processing (2)
Try to 개발자 EthanJ의 성장 로그

Titanic data pre-processing with pandas 판다스 타이타닉 데이터 전처리 In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt Data 추출¶ In [2]: data = pd.read_csv('data/train.csv') In [3]: data.head() Out[3]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cumings, Mrs. J..

Pandas Data pre-processing 판다스 데이터 전처리 1. Hierarchical Indexing 계층 색인¶ 행, 열의 각 축에 대해 다중 단계(계층)를 지정하여 데이터에 차원을 설정 index에 다차원 리스트를 전달하면 계층 색인을 지정할 수 있음 데이터 구조를 재배열하거나 pivot 테이블과 같은 group 기반 작업에 유용 재배열 method stack() : column을 row로 pivot unstack() : row를 column으로 pivo In [1]: import pandas as pd import numpy as np 1.1. Series Hierarchical Indexing 시리즈 계층 색인¶ index에 다차원 리스트(아이템 2개)를 전달 다차원리스트[0]: 상위..