사이킷런에서 제공하는 토이 데이터셋인 보스톤 주택 가격 데이터셋을 불러오고, 간단하게 내용을 살펴보는 코드이다.
from sklearn.datasets import load_boston
import pandas as pd
boston = load_boston()
print(boston)
print(boston.keys())
print(boston.DESCR)
df = pd.DataFrame(boston.data, columns=boston.feature_names)
df['target'] = boston.target
print(df.head())
df.tail()
print(df.shape)
print(df.describe())
print(df.iloc[:,-1].value_counts())
X_data = boston.data
y_data = boston.target
print(X_data)
print(y_data)
데이터셋의 속성 설명을 구글로 번역한 내용이다.
참조 : https://scikit-learn.org/stable/datasets/index.html#toy-datasets
'머신러닝 > 데이터셋' 카테고리의 다른 글
1-2-2. 아이리스 데이터셋 (Iris plants dataset) (0) | 2020.09.08 |
---|---|
1-2. 머신러닝 학습용 데이터셋 - 사이킷런(scikit-learn) 토이 데이터셋(Toy Datasets) (0) | 2020.09.08 |