▶random_state에 대해서 머신러닝을 공부하다보면 'random_state='를 설정해주는 것을 많이 보셨을 겁니다. 왜 사용하는 것이며 숫자가 의미하는 것은 무엇일까요? 결론부터 말하자면, 수행시마다 동일한 결과를 얻기 위해 적용하는 것입니다. 가장 쉬운 예를 들기 위해 KFold 교차 검증에서 살펴보겠습니다. 위 그림에서 각각 반복문마다 다르게 test set와 train set을 나누게 되는데 저 값들이 고정이 되어있지 않다면 정말 나쁘게 말해 의도와는 다르게 똑같은 test set와 train set이 만들어질 수도 있다는 것입니다. 그렇기 때문에 random_state 속성을 주어 random한 값을 고정하는 역할을 수행하게 해줍니다. 또 다른 예시로 의사결정나무 기본 모델을 만들고 이후..
▶회귀분석(Regression) 머신러닝은 데이터를 읽어 학습하고 예측값을 찾는 것입니다. 그중에서도 회귀분석은 독립변수(x)와 종속변수(y)를 예측하는 것을 의미합니다. 이번 글에서는 사이킷런에서 제공하고 있는 데이터셋인 '보스턴의 집값 데이터' load_boston을 이용해서 공부할 예정입니다. import pandas as pd import numpy as np np.set_printoptions(suppress-True) # 19e-2 이런식으로 e를 사용하지 않고 그냥 펼쳐서 보여줌 ▷데이터 확인 및 불러오기 from sklearn.datasets import load_boston data = load_boston() data 객체를 만들고서 print 해보면 우리가 원하는 데이터 뿐만 아니라 ..
▶파이토치(Pytorch) 파이토치는 tensorflow와 함께 머신러닝, 딥러닝에서 가장 너리 사용되는 프레임워크입니다. 초기에는 Torch라는 이름으로 Lua언어 기반으로 만들어졌으나, 이후 파이썬 기반으로 변경한 것이 Pytorch입니다. import torch print(torch.__version__) # 1.12.0+cu113 ▷Tensor는 데이터 타입 텐서는 배열이나 행렬과 매우 유사한 특수 자료구조입니다. 파이토치는 텐서를 사용하여 모델의 입력과 출력, 모델의 매개변수들을 부호화합니다. 지난 텐서플로우 글에서도 말했듯이 tensor는 tensorflow와 연관되었다기보다는 데이터 타입입니다. 1) ndarray / list → tensor : tensor() 파이토치는 텐서플로우와 같이 ..
▶텐서플로우(TensorFlow) 텐서플로우는 머신러닝 모델을 개발하고 학습시키는 데에 도움이 되는 핵심 오플 소스 라이브러리입니다. 텐서플로우 2.x에서는 케라스를 딥러닝 공식 API로 채택하였고, 텐서플로우 내의 하나의 프레임워크로 개발되고 있습니다. 라이브러리를 import 해봅시다. import tensorflow as tf 버전도 확인해봅시다. print(tf.__version__) # 2.8.2 ▷Tensor Tensor는 multi-dimensional array를 나탄는 말로, Tensor flow의 기본 데이터 타입입니다. 다시 말해서 tensor는 데이터 타입입니다. 1) 상수 정의 : constant() 텐서플로우에서는 변수와 상수 기능을 제공합니다. 상수는 변하지 않는 숫자를 의미하..
▶kaggle Kaggle: Your Machine Learning and Data Science Community Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals. www.kaggle.com kaggle에서는 전세계 데이터 사이언티스트들이 다양한 데이터를 분석하고 토론할 수 있는 커뮤니티를 제공하고 있습니다. 또한 데이터 분석 및 머신러닝, 딥러닝 대회를 개최 및 다양한 데이터셋, 파이썬 자료, R 자료들을 제공하고 있습니다. 이번 글에서는 kaggle에서 제공하고 있는 가장 대표적인 데이터셋인 타이타닉 데이터셋으로 실..
▶Scikit-learn 모듈 대표적인 파이썬 머신러닝 프레임워크로서 다양한 머신러닝 알고리즘과 샘플 데이터를 제공합니다. 또한 머신러닝 결과를 검증하는 기능도 제공합니다. (BSD 라이선스이기 때문에 무료로 사용 및 배포가 가능합니다.) 자세한 내용은 다음 사이트를 참고하면 좋겠습니다. scikit-learn: machine learning in Python — scikit-learn 0.16.1 documentation scikit-learn.org 1) LinearSVC 클래스 구분을 하는 분류 문제에서 각 클래스를 잘 구분하는 선을 그려주는 방식을 사용하는 알고리즘입니다. 지도 학습 알고리즘을 사용하는 학습 전용 데이터(x)와 결과 전용 데이터(y)를 함께 가지고 있어야 사용이 가능합니다. 우선 ..
- Total
- Today
- Yesterday
- 자바스크립트
- 프로젝트 회고
- TypeScript
- 디프만
- 리액트 훅
- 프론트엔드
- 프론트엔드 기초
- 데이터분석
- frontend
- 머신러닝
- 인프런
- testing
- 리액트
- HTML
- 타입스크립트
- rtl
- 딥러닝
- jest
- react-query
- JSP
- 자바
- next.js
- styled-components
- 자바스크립트 기초
- react
- 파이썬
- 프론트엔드 공부
- CSS
- 스타일 컴포넌트 styled-components
- Python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |