머신러닝 데이터셋 중에서 정말 유명한 데이터셋이다.
아이리스 붓꽃의 데이터셋을 불러오고, 기본 내용을 살펴보는 코드이다.
from sklearn.datasets import load_iris
import pandas as pd
iris = load_iris()
print(iris)
print(iris.keys())
print(iris.DESCR)
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
print(df.head())
df.tail()
print(df.shape)
print(df.describe())
print(df.iloc[:,-1].value_counts())
print(df.target.value_counts())
X_data = iris.data
y_data = iris.target
print(X_data)
print(y_data)
속성값은 아래의 4개이다.
- sepal length : 꽃받침 길이
- sepal width : 꽃받침 너비
- petal length : 꽃잎 길이
- petal width : 꽃잎 너비
'머신러닝 > 데이터셋' 카테고리의 다른 글
1-2-1. 보스톤 주택 가격 데이터셋 (Boston house prices dataset) (0) | 2020.09.08 |
---|---|
1-2. 머신러닝 학습용 데이터셋 - 사이킷런(scikit-learn) 토이 데이터셋(Toy Datasets) (0) | 2020.09.08 |