make_blobs
모든 방향으로 같은 성질을 가지는 정규분포를 이용해 가상 데이터 생성
클러스링 용 가상데이터를 생성하는데 사용
make_blobs 함수의 인수, 반환값
1. 인수
- n_samples, n_features, centers, cluster_std, center_box
- n_samples : 표본 데이터 수, 기본값 100
- n_features : 독립 변수 수, 기본값 20
- centers : 클러스터 수 혹은 중심, 기본값 3
- cluster_std: 클러스터 표준 편차, 기본값 1.0
- center_box: 클러스터 바운딩 박스(bounding box), 기본값 (-10.0, 10.0))
2. 반환값
- X : [n_samples, n_features] 크기의 배열
- y : [n_samples] 크기의 배열
from matplotlib import pyplot as plt
from sklearn.datasets import make_blobs
plt.title("3 clusters")
X, y = make_blobs(n_samples=300, n_features=2, centers=3, random_state=3)
plt.scatter(X[:, 0], X[:, 1],
marker='x',
c=y,
s=30,
edgecolor="k", linewidth=2)
plt.xlabel("X1")
plt.ylabel("X2")
plt.show()
'머신러닝 > 알고리즘' 카테고리의 다른 글
타이타닉 생존자 예측 - KNN 알고리즘 실습 (0) | 2020.11.19 |
---|---|
5-3. Apriori (연관규칙) (0) | 2020.09.12 |
5-2-1. k-means 실습 (0) | 2020.09.12 |
5-2. k-means (k-평균 알고리즘) (0) | 2020.09.12 |
5-1-1. SVM 실습 (0) | 2020.09.12 |