본문 바로가기

머신러닝/알고리즘

make_blobs

make_blobs

 

모든 방향으로 같은 성질을 가지는 정규분포를 이용해 가상 데이터 생성

클러스링 용 가상데이터를 생성하는데 사용

 

make_blobs 함수의 인수, 반환값

1. 인수

 - n_samples, n_features, centers, cluster_std, center_box

 - n_samples : 표본 데이터 수, 기본값 100

 - n_features : 독립 변수 수, 기본값 20

 - centers : 클러스터 수 혹은 중심, 기본값 3

 - cluster_std: 클러스터 표준 편차, 기본값 1.0

 - center_box: 클러스터 바운딩 박스(bounding box), 기본값 (-10.0, 10.0))

 

2. 반환값

 - X : [n_samples, n_features] 크기의 배열

 - y : [n_samples] 크기의 배열

 

from matplotlib import pyplot as plt
from sklearn.datasets import make_blobs

plt.title("3 clusters")
X, y = make_blobs(n_samples=300, n_features=2, centers=3, random_state=3)

plt.scatter(X[:, 0], X[:, 1],
            marker='x',
            c=y,            
            s=30,
            edgecolor="k", linewidth=2)
plt.xlabel("X1")
plt.ylabel("X2")
plt.show()

'머신러닝 > 알고리즘' 카테고리의 다른 글

타이타닉 생존자 예측 - KNN 알고리즘 실습  (0) 2020.11.19
5-3. Apriori (연관규칙)  (0) 2020.09.12
5-2-1. k-means 실습  (0) 2020.09.12
5-2. k-means (k-평균 알고리즘)  (0) 2020.09.12
5-1-1. SVM 실습  (0) 2020.09.12