본문 바로가기

머신러닝/EDA

(4)
3-1. EDA-Titanic 실습 3 part 3 sns.distplot(df_train['age'][df_train['sex']=='male']) sns.distplot(df_train['age'][df_train['sex']=='female']) sns.lmplot('age', 'survived', hue='sex', data=df_train) sns.factorplot('age', kind='count', hue='survived', data=df_train) sns.factorplot('age', kind='count', hue='survived', data=df_train[df_train['age'] < 6]) sns.factorplot('age', kind='count', hue='survived', data=df_train[df..
3-2. EDA-Titanic 실습 2 part 2 df_train['embarked'] = df_train['embarked'].fillna('S') df_train.drop(['boat'], axis='columns', inplace=True) df_train df_train.drop(['body'], axis='columns', inplace=True) df_train_temp = df_train.drop(['home.dest'], axis='columns', inplace=False) df_train_temp df_train.drop(['home.dest'], axis='columns', inplace=True) df_train['fare'] = df_train['fare'].fillna(0) df_train.head(10) # cab..
3-1. EDA-Titanic 실습 1 part 1 # 데이터프레임을 이용하기 위하여 판다스 패키지를 임포트한다 import pandas as pd # 구글에서 titanic filetype:xls 로 검색 df_train = pd.read_excel('/content/drive/My Drive/Colab Notebooks/data/titanic.xls') df_train.head() df_train.head(10) df_train.columns - pclass : 승선 클래스 - survived : 생존여부(1:생존, 0:사망) - name : 이름 - sex : 성별 - age : 나이 - sibsp : 형제자매, 배우자 수 - parch : 부모, 자식 수 - tichet : 티켓번호 - fare : 요금 - cabin : 객실번호 - ..
3. EDA-타이타닉 생존자 예측 1912년 4월 10일 영국의 사우샘프턴을 떠나 미국의 뉴욕으로 향하던 첫 항해 중, 4월 15일 빙산과 충돌하여 침몰하였다. 타이타닉의 침몰로 1,514명이 사망 선내에 체육관과 수영장, 그외 호화로운 부대시설을 갖추고 있었음 구명정은 20척 구명정의 정원은 1,178명 1912년 4월 14일 오후 11시 40분(선내 시각, GMT -3)빙산과 충돌 2시간 40분만에 완전 침수 타이타닉호 구조 1등실 1등실에는 총 329명의 부유한 승객 탑승 객실은 최상층인 보트 갑판부터 갑판 E(상갑판)까지 설치 호화 호텔 수준 개인 목욕탕 준비 2등실 2등실에는 총 285명의 중산층 승객이 탑승 비교적 편리한 시설이 설치 객실은 갑판 D부터 갑판 F까지 설치 흡연실(갑판 B), 레스토랑(갑판 B), 도서관(갑판 C..