본문 바로가기

머신러닝/데이터셋

1-2-1. 보스톤 주택 가격 데이터셋 (Boston house prices dataset)

사이킷런에서 제공하는 토이 데이터셋인 보스톤 주택 가격 데이터셋을 불러오고, 간단하게 내용을 살펴보는 코드이다.

 

from sklearn.datasets import load_boston
import pandas as pd

boston = load_boston()
print(boston)
print(boston.keys())
print(boston.DESCR)

df = pd.DataFrame(boston.data, columns=boston.feature_names)
df['target'] = boston.target
print(df.head())
df.tail()

print(df.shape)
print(df.describe())

print(df.iloc[:,-1].value_counts())

X_data = boston.data
y_data = boston.target

print(X_data)
print(y_data)

 

데이터셋의 속성 설명을 구글로 번역한 내용이다.

속성값 구글 번역

참조 : https://scikit-learn.org/stable/datasets/index.html#toy-datasets