일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 파이썬 제어문
- KMeans Clustering
- Python crawler
- Titanic data set
- dataframe
- Naive Bayes
- scikit-learn
- python control statement
- 사이킷런
- 파이썬 크롤러
- control statement
- 타이타닉 데이터
- 판다스
- NumPy
- 파이썬
- K평균군집화
- 순회 크롤러
- Data pre-processing
- 제어문
- pandas
- python
- Machine Learning
- 배열
- 파이썬 크롤링
- sklearn
- 머신러닝
- 파이썬 객체 지향 프로그래밍
- 넘파이
- ML
- 나이브베이즈
- Today
- Total
목록Data pre-processing (2)
Try to 개발자 EthanJ의 성장 로그

Titanic data pre-processing with pandas 판다스 타이타닉 데이터 전처리 In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt Data 추출¶ In [2]: data = pd.read_csv('data/train.csv') In [3]: data.head() Out[3]: PassengerId Survived Pclass Name Sex Age SibSp Parch Ticket Fare Cabin Embarked 0 1 0 3 Braund, Mr. Owen Harris male 22.0 1 0 A/5 21171 7.2500 NaN S 1 2 1 1 Cumings, Mrs. J..

Pandas Data pre-processing 판다스 데이터 전처리 1. Hierarchical Indexing 계층 색인¶ 행, 열의 각 축에 대해 다중 단계(계층)를 지정하여 데이터에 차원을 설정 index에 다차원 리스트를 전달하면 계층 색인을 지정할 수 있음 데이터 구조를 재배열하거나 pivot 테이블과 같은 group 기반 작업에 유용 재배열 method stack() : column을 row로 pivot unstack() : row를 column으로 pivo In [1]: import pandas as pd import numpy as np 1.1. Series Hierarchical Indexing 시리즈 계층 색인¶ index에 다차원 리스트(아이템 2개)를 전달 다차원리스트[0]: 상위..