본문 바로가기

머신러닝/데이터셋

1-2-2. 아이리스 데이터셋 (Iris plants dataset)

머신러닝 데이터셋 중에서 정말 유명한 데이터셋이다.

아이리스 붓꽃의 데이터셋을 불러오고, 기본 내용을 살펴보는 코드이다.

 

from sklearn.datasets import load_iris
import pandas as pd

iris = load_iris()

print(iris)

print(iris.keys())

print(iris.DESCR)

df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
print(df.head())
df.tail()

print(df.shape)
print(df.describe())

print(df.iloc[:,-1].value_counts())
print(df.target.value_counts())

X_data = iris.data
y_data = iris.target

print(X_data)
print(y_data)

속성값은 아래의 4개이다.

 - sepal length : 꽃받침 길이

 - sepal width : 꽃받침 너비

 - petal length : 꽃잎 길이

 - petal width : 꽃잎 너비