머신러닝/데이터셋 (3) 썸네일형 리스트형 1-2-2. 아이리스 데이터셋 (Iris plants dataset) 머신러닝 데이터셋 중에서 정말 유명한 데이터셋이다. 아이리스 붓꽃의 데이터셋을 불러오고, 기본 내용을 살펴보는 코드이다. from sklearn.datasets import load_iris import pandas as pd iris = load_iris() print(iris) print(iris.keys()) print(iris.DESCR) df = pd.DataFrame(iris.data, columns=iris.feature_names) df['target'] = iris.target print(df.head()) df.tail() print(df.shape) print(df.describe()) print(df.iloc[:,-1].value_counts()) print(df.target.val.. 1-2-1. 보스톤 주택 가격 데이터셋 (Boston house prices dataset) 사이킷런에서 제공하는 토이 데이터셋인 보스톤 주택 가격 데이터셋을 불러오고, 간단하게 내용을 살펴보는 코드이다. from sklearn.datasets import load_boston import pandas as pd boston = load_boston() print(boston) print(boston.keys()) print(boston.DESCR) df = pd.DataFrame(boston.data, columns=boston.feature_names) df['target'] = boston.target print(df.head()) df.tail() print(df.shape) print(df.describe()) print(df.iloc[:,-1].value_counts()) X_data.. 1-2. 머신러닝 학습용 데이터셋 - 사이킷런(scikit-learn) 토이 데이터셋(Toy Datasets) 머신러닝 학습을 위해서는 여러 종류의 데이터셋이 필요하다. 좋은 데이터셋의 확보는 머신러닝 알고리즘을 이해하는데 굉장히 큰 영향을 미친다. Python을 활용한 머신러닝 학습에 있어서 가장 많이 사용하는 라이브러리 중의 하나는 사이킷런(scikit-learn)이다. 사이킷런에서는 각종 데이터셋을 제공하고 있다. 사이킷런에서 제공하는 데이터셋에는 7가지의 Toy datasets이 있다. 토이데이터셋은 머신러닝 학습용으로 제공하는 데이터셋이라고 이해하면 된다. 7가지 데이터셋을 소개하고 그 중, 우리가 활용할 데이터셋은 필요 시, 조금 더 자세히 소개한다. 1. Boston house prices dataset 보스톤 주택 가격 데이터셋 506개 데이터 2. Iris plants dataset 아이리스(붓꽃.. 이전 1 다음