본문 바로가기

머신러닝/알고리즘

(16)
2-1. Decision Tree (의사결정나무) Decision Tree (의사결정나무) 결정나무, 의사결정나무, 결정트리, 디시즌트리 등의 용어로 불려짐 지도학습 알고리즘 변수를 기반으로 분류하거나 예측하는데 사용하는 알고리즘 용도에 따라서, 분류나무 혹은 회귀나무라고도 칭함 범주형인 경우 분류, 수치형인 경우 예측 혹은 회귀 CART(Classification And Regression Tree), C4.5, CHAID(Chi-square Automatic Interation Detection) 세가지가 대표적인 종류 각각 지니 지수(Gini index), 엔트로피 지수(entropy index), 카이제곱 통계량( Chi-Square statistic)을 불순도(Impurity) 알고리즘으로 사용함 구분 CART C4.5 CHAID 분류 가능 가..
1-3-2. KNN 실습 2 사이킷런에서 KNN 실습 예제 코드를 확인해 본다. 아이리스 데이터셋을 이용하여 분류하는 예제 코드이다. print(__doc__) import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap from sklearn import neighbors, datasets n_neighbors = 15 # import some data to play with iris = datasets.load_iris() # we only take the first two features. We could avoid this ugly # slicing by using a two-dim dataset X = iris.d..
1-3-1. KNN 실습 1 KNN 실습코드 주소 https://github.com/rickiepark/introduction_to_ml_with_python/blob/master/02-supervised-learning.ipynb ln [11] 부터 ln [18] 까지 코드 실습 실습을 위해서 아래 내용을 먼저 수행하여야 에러 없이 정상 진행됨. * 코드 가장 처음에 mglearn 설치 !pip install mglearn * 패키지 임포트 import mglearn import matplotlib.pyplot as plt
1-3. KNN (K Nearest Neighbors) KNN(K Nearest Neighbors) k-최근접 이웃 알고리즘을 줄여서 KNN 이라고 함 k개의 최근접 이웃을 확인함 k-NN, K-NN, kNN, KNN 등으로 표현함 가장 쉬운 알고리즘의 하나이고, 지도학습에 속한다 Classification(분류)의 기본적인 알고리즘 새로운 데이터를 입력 받았을 때, 해당 데이터와 가장 가까운(근접한) 데이터들을 확인하고, 그 중, 많은(빈도가 높은) 데이터의 종류를 따라 분류하는 알고리즘