make_blobs

모든 방향으로 같은 성질을 가지는 정규분포를 이용해 가상 데이터 생성

클러스링 용 가상데이터를 생성하는데 사용

make_blobs 함수의 인수, 반환값

1. 인수

- n_samples, n_features, centers, cluster_std, center_box

- n_samples : 표본 데이터 수, 기본값 100

- n_features : 독립 변수 수, 기본값 20

- centers : 클러스터 수 혹은 중심, 기본값 3

- cluster_std: 클러스터 표준 편차, 기본값 1.0

- center_box: 클러스터 바운딩 박스(bounding box), 기본값 (-10.0, 10.0))

2. 반환값

- X : [n_samples, n_features] 크기의 배열

- y : [n_samples] 크기의 배열

from matplotlib import pyplot as plt
from sklearn.datasets import make_blobs

plt.title("3 clusters")
X, y = make_blobs(n_samples=300, n_features=2, centers=3, random_state=3)

plt.scatter(X[:, 0], X[:, 1],
            marker='x',
            c=y,            
            s=30,
            edgecolor="k", linewidth=2)
plt.xlabel("X1")
plt.ylabel("X2")
plt.show()

'머신러닝 > 알고리즘' 카테고리의 다른 글

타이타닉 생존자 예측 - KNN 알고리즘 실습 (0)	2020.11.19
5-3. Apriori (연관규칙) (0)	2020.09.12
5-2-1. k-means 실습 (0)	2020.09.12
5-2. k-means (k-평균 알고리즘) (0)	2020.09.12
5-1-1. SVM 실습 (0)	2020.09.12

인공지능과 달리기

make_blobs

'머신러닝 > 알고리즘' 카테고리의 다른 글

티스토리툴바

make_blobs

'머신러닝 > 알고리즘' 카테고리의 다른 글

'머신러닝/알고리즘' Related Articles

티스토리툴바