'빅데이터 인공지능' 카테고리의 글 목록 (6 Page)

▶앙상블(Ensemble) 모델 머신러닝 앙상블이란 여러 개의 머신러닝 모델을 이용해 최적의 답을 찾아내는 기법입니다. 앙상블 기법의 종류는 다음과 같습니다. 보팅(Voting) : 투표를 통해 결과를 도출 배깅(Bagging) : 샘플 중복 생성을 통해 결과를 도출 부스팅(Boosting) : 이전 오차를 보완하면서 가중치를 부여 스태킹(Stacking) : 여러 모델을 기반으로 예측된 결과를 통해 meta 모델이 다시 한번 에측 이전에 회귀(Regression) 모델 글에서 사용한 예측 성능 시각화 함수(mse_eval)를 이용해서 모델 성능을 비교해보겠습니다. 함수에 대한 자세한 설명은 다음 링크를 참고해주세요 :) [머신러닝] ⑥ 회귀(Regression) 분석 A to Z ▶회귀분석(Regres..

빅데이터 인공지능/머신러닝 2022. 8. 21. 17:49

[머신러닝] ⑧ 오차 행렬(Confusion matrix) in 분류

▶오차행렬(Confusion matrix) in 분류 1) 정확도(Accuracy) : 예측이 정답과 얼마나 정확한가 우리는 다음 코드와 같이 간단하게 정확도를 확인할 수가 있습니다. (y_pred == y_yest).mean() 하지만 정확도만 높고 보면 무조건 음성 환자로 예측하는 분류기가 성능이 좋습니다. 그렇기 때문에 정확도만 보고 분류기의 성능의 판별하는 것은 오류에 빠질 수가 있습니다. 이를 보완하기 위해 생겨난 지표는 오차 행렬에 대해 알아봅시다. from sklearn.metrice import confusion_matirx confusion_matirx(y_test, pred) out: 이처럼 array 형식으로 출력되는데 좀 더 보기 편하게 시각화를 해보겠습니다. sns.heatmap(..

빅데이터 인공지능/머신러닝 2022. 8. 19. 11:41

[머신러닝] ⑦ 분류(Classification) 모델

▶분류(Classification) 말 그대로 Classification은 지도학습의 일종으로 기존에 존재하는 데이터의 카테고리 관계를 파악하고, 새로운 데이터의 카테고리를 스스로 판별하는 과정입니다. 종류에는 예를 들어 스팸메일인지 아닌지 분류하는 것처럼 단일 분류와 수능등급이 몇 등급에 해당하는지 판별하는 것처럼의 다중 분류가 있습니다. 1) Logistic Regression - 로지스틱 회귀 로지스틱은 독립 변수(x)의 선형 결합을 이용하여 사건의 발생 가능성을 예측하는 데 사용되는 통계 기반으로서 이진 분류만 가능합니다. 그렇지만 3개 이상의 클래스에 대한 판별 즉 다중 분류를 진행하는 경우 아래와 같은 전략으로 판별이 가능합니다. one-vs-rest(0vR) : k개의 클래스가 존재할 때, ..

빅데이터 인공지능/머신러닝 2022. 8. 19. 11:00

[머신러닝] ⑥ 회귀(Regression) 분석 A to Z

▶회귀분석(Regression) 머신러닝은 데이터를 읽어 학습하고 예측값을 찾는 것입니다. 그중에서도 회귀분석은 독립변수(x)와 종속변수(y)를 예측하는 것을 의미합니다. 이번 글에서는 사이킷런에서 제공하고 있는 데이터셋인 '보스턴의 집값 데이터' load_boston을 이용해서 공부할 예정입니다. import pandas as pd import numpy as np np.set_printoptions(suppress-True) # 19e-2 이런식으로 e를 사용하지 않고 그냥 펼쳐서 보여줌 ▷데이터 확인 및 불러오기 from sklearn.datasets import load_boston data = load_boston() data 객체를 만들고서 print 해보면 우리가 원하는 데이터 뿐만 아니라 ..

빅데이터 인공지능/머신러닝 2022. 8. 12. 11:18

[머신러닝] ⑤ 파이썬 파이토치(Pytorch)

▶파이토치(Pytorch) 파이토치는 tensorflow와 함께 머신러닝, 딥러닝에서 가장 너리 사용되는 프레임워크입니다. 초기에는 Torch라는 이름으로 Lua언어 기반으로 만들어졌으나, 이후 파이썬 기반으로 변경한 것이 Pytorch입니다. import torch print(torch.__version__) # 1.12.0+cu113 ▷Tensor는 데이터 타입 텐서는 배열이나 행렬과 매우 유사한 특수 자료구조입니다. 파이토치는 텐서를 사용하여 모델의 입력과 출력, 모델의 매개변수들을 부호화합니다. 지난 텐서플로우 글에서도 말했듯이 tensor는 tensorflow와 연관되었다기보다는 데이터 타입입니다. 1) ndarray / list → tensor : tensor() 파이토치는 텐서플로우와 같이 ..

빅데이터 인공지능/머신러닝 2022. 8. 11. 12:12

[머신러닝] ④ 파이썬 텐서플로우(TensorFlow)

▶텐서플로우(TensorFlow) 텐서플로우는 머신러닝 모델을 개발하고 학습시키는 데에 도움이 되는 핵심 오플 소스 라이브러리입니다. 텐서플로우 2.x에서는 케라스를 딥러닝 공식 API로 채택하였고, 텐서플로우 내의 하나의 프레임워크로 개발되고 있습니다. 라이브러리를 import 해봅시다. import tensorflow as tf 버전도 확인해봅시다. print(tf.__version__) # 2.8.2 ▷Tensor Tensor는 multi-dimensional array를 나탄는 말로, Tensor flow의 기본 데이터 타입입니다. 다시 말해서 tensor는 데이터 타입입니다. 1) 상수 정의 : constant() 텐서플로우에서는 변수와 상수 기능을 제공합니다. 상수는 변하지 않는 숫자를 의미하..

빅데이터 인공지능/머신러닝 2022. 8. 11. 11:14

이전 1 ··· 3 4 5 6 7 8 9 다음

이전 다음

250x250

공지사항

최근에 올라온 글

최근에 달린 댓글

Total

Today

Yesterday

링크

TAG more

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

글 보관함

doeunn.log

티스토리툴바