본문 바로가기

전체 글

(58)
1-2-2. 아이리스 데이터셋 (Iris plants dataset) 머신러닝 데이터셋 중에서 정말 유명한 데이터셋이다. 아이리스 붓꽃의 데이터셋을 불러오고, 기본 내용을 살펴보는 코드이다. from sklearn.datasets import load_iris import pandas as pd iris = load_iris() print(iris) print(iris.keys()) print(iris.DESCR) df = pd.DataFrame(iris.data, columns=iris.feature_names) df['target'] = iris.target print(df.head()) df.tail() print(df.shape) print(df.describe()) print(df.iloc[:,-1].value_counts()) print(df.target.val..
1-2-1. 보스톤 주택 가격 데이터셋 (Boston house prices dataset) 사이킷런에서 제공하는 토이 데이터셋인 보스톤 주택 가격 데이터셋을 불러오고, 간단하게 내용을 살펴보는 코드이다. from sklearn.datasets import load_boston import pandas as pd boston = load_boston() print(boston) print(boston.keys()) print(boston.DESCR) df = pd.DataFrame(boston.data, columns=boston.feature_names) df['target'] = boston.target print(df.head()) df.tail() print(df.shape) print(df.describe()) print(df.iloc[:,-1].value_counts()) X_data..
1-2. 머신러닝 학습용 데이터셋 - 사이킷런(scikit-learn) 토이 데이터셋(Toy Datasets) 머신러닝 학습을 위해서는 여러 종류의 데이터셋이 필요하다. 좋은 데이터셋의 확보는 머신러닝 알고리즘을 이해하는데 굉장히 큰 영향을 미친다. Python을 활용한 머신러닝 학습에 있어서 가장 많이 사용하는 라이브러리 중의 하나는 사이킷런(scikit-learn)이다. 사이킷런에서는 각종 데이터셋을 제공하고 있다. 사이킷런에서 제공하는 데이터셋에는 7가지의 Toy datasets이 있다. 토이데이터셋은 머신러닝 학습용으로 제공하는 데이터셋이라고 이해하면 된다. 7가지 데이터셋을 소개하고 그 중, 우리가 활용할 데이터셋은 필요 시, 조금 더 자세히 소개한다. 1. Boston house prices dataset 보스톤 주택 가격 데이터셋 506개 데이터 2. Iris plants dataset 아이리스(붓꽃..
1-1. 기계학습 (Machine Learning) 종류 지도학습 (Supervised Learning) - 정답(label)이 있음 - Data와 Target으로 구성 - 결과를 분류하거나 예측하는 목적으로 사용 - 분류 : 범주형, 예측 : 수치형 - 선형회귀, k-최근접이웃, 의사결정나무, 랜덤포레스트, 나이브베이즈, 서포트백신(SVM) 비지도학습(Unsupervised Learning) - 정답이 없음 - 데이터에서 숨겨진 구성을 찾아냄 - 군집화(Clustering)에 사용 - K-means, 연관규칙(Apriori) 강화학습(Reinforcement Learning) 정답은 없지만, 보상을 기반으로 학습 - 보상을 최대로 하는 행동 혹은 순서를 결정
강사 소개 이름 : 최 대 현 학력 학교 전공 학위 비고 울산과학대학교 전자계산과 전문학사 국가평생교육진흥원 전자계산학과 학사 울산대학교 산업대학원 컴퓨터정보통신학과 석사 울산대학교 일반대학원 산업경영공학과 박사 수료 경력 기간 기관 직위 비고 1997.10 ~ 1999.07 미래정보 사원 개발자 2001.10 ~ 2003.03 (주)씨디엠 팀장 PM 2003.04 ~ 2003.11 (사)KH정보교육원 강사 IT솔루션개발자 과정 2003.12 ~ 2004.12 (주)씨디엠 부장 PM 2005.04 ~ 현재까지 (주)엔소프트 대표이사 2010 ~ 2011 울산과학대학교 외래강사 4학기 관심분야 스마트팩토리 (MES, APS, QMS, WMS) 인공지능 데이터분석 RPA (Robotic Process Automatio..
고급과정 강의 계획 AI 학습 실제 16차 (2020년 8월 31일 월요일) 인공지능 개요 머신러닝 개발환경 17차 (2020년 9월 8일 화요일) 머신러닝 학습용 데이터셋 - 보스톤 주택 가격 데이터셋 - 아이리스 붓꽃 데이터셋 KNN(K Nearest Neighbors) - mglearn KNN 실습 - sklearn KNN 실습 18차 (2020년 9월 9일 수요일) sklearn KNN 실습 코드 리뷰 결정트리(Decision Tree) 결정트리(Decision Tree) 실습 19차 (2020년 9월 10일 목요일) EDA (탐색적 자료 분석, Exploratory Data Analysis) - 타이타닉 생존자 예측 데이터셋 - 타이타닉 데이터셋 EDA 실습 20차 (2020년 9월 11일 금요일) 알고리즘 적용 ..
머신러닝 개발환경 아나콘다(anaconda), 텐서플로(tensorflow), 케라스(keras), 주피터노트북(jupyter notebook) ... @@ 아나콘다(anaconda) 아나콘다는 다음 패키지들을 포함하고 있음. sklearn : scikit-learn. 머신러닝 교육용 파이썬 패키지 pandas : 판다스. 데이터분석, 처리를 쉽게 하기 위한 패키지 numpy : 넘파이. 과학계산 컴퓨팅에 사용하는 패키지 scipy : 사이파이. 과학기술 계산 기능 제공 패키지 Anaconda | The World's Most Popular Data Science Platform Anaconda is the birthplace of Python data science. We are a movement of data sci..
국내 인공지능 기술 현황 2020년 AI 7대 트렌드 공지사항 ㅣ 공지사항 ㅣ ETRI 소식 ㅣ 한국전자통신연구원 「2020년 AI 7대 트렌드 - Beyond Perception」 본 보고서는 ETRI 기술정책연구본부 주요사업인 "ICT R&D 경쟁력 제고를 위한 기술경제 및 표준화 연구"를 통해 작성되었습니다. 1. 또 다른 선택, 중국 AI www.etri.re.kr 2019년 NIA AI Index - 우리나라 인공지능(AI) 수준 조사 [IT&Future Strategy] 2019년 NIA AI Index - 우리나라 인공지능(AI) 수준 조사 - | AI Hub [IT&Future Strategy] 2019년 NIA AI Index - 우리나라 인공지능(AI) 수준 조사 - [IT&Future Strategy 2019..
가트너 2020년 10대 전략 기술 트렌드 가트너 2020년 10대 전략 기술 트렌드 가트너(Gartner)는 다국적 IT기업 및 각국의 정부기관 등을 주 고객으로 두고 있으며, 설문 조사 부분의 높은 신뢰도로 공신력이 큰 미국의 정보 기술 연구 및 자문 회사이다. 가트너는 매년 전략 기술 트렌드를 발표한다. 아래 링크에서 원문을 확인할 수 잇다. Gartner Top 10 Strategic Technology Trends for 2020 Hyperautomation, blockchain, AI security, distributed cloud and autonomous things drive disruption and create opportunities in this year's strategic technology trends. www.ga..
교육과정 지역거점 AI (기본, 고급)과정 2기 교육과정