
우리가 이전까지 공부했던 numpy, pandas, 데이터전처리, matplotlib를 총합해서 직접 프로젝트를 진행해보겠습니다 :) 1) 사용할 데이터셋 간단 설명 - 온라인 리테일 사이트의 2010/12-2011/12까지의 주문 기록 데이터 - 약 500,000건의 데이터 2) 라이브러리 불러오기 import numpy as np import pandas as pd 3) csv 파일 불러오기 retail = pd.read_csv('OnlineRetail.csv') 4) 파일 정보 알아보기 reatil.info() out:::: - 총 541,909개의 entries # InvoiceNo : 주문번호 # StockCode : 아이템 아이디 # Description : 상품 설명 # Quantity : ..

이전 글에서 수행한 전처리 파일을 matplotlib 라이브러리를 활용해서 시각화를 해봅시다 :) [matplotlib 라이브러리] - 파이썬 기반 시각화 라이브러리 - import matplotlib.pyplot as plt - 파이썬 표준 시각화 도구라고 불릴만큼 다양한 기능을 지원 - pandas와 연동이 용이함 - 한글에 대한 지원이 완벽하지 않음 - 세부 기능이 많으나 사용성이 복잡하다고 느낄 수도 있음 - https://matplotlib.org/ Matplotlib — Visualization with Python seaborn seaborn is a high level interface for drawing statistical graphics with Matplotlib. It aims ..

이전까지 공부했던 numpy와 pandas를 활용하여 데이터 전처리를 해봅시다 :) - 공공데이터 포털(https://www.data.go.kr/)에서 제공하는 데이터를 활용 - 민간 아파트 가격동향 데이터(http://bit.ly/ds-house-price)를 이용 🌟 /// Error 메세지를 잘 확인해서 전처리를 이어가자 /// 🌟 우선 모듈을 불러오겠습니다. import pandas as pd 오늘 이용할 데이터셋을 불러오겠습니다. df = pd.read_csv('http://bit.ly/ds-house-price') # df에 저장 데이터셋을 우선 살펴보겠습니다. df out:::: - 5개의 컬럼과 4505개의 데이터가 있음 - 컬럼은 '지역명', '규모구분', '연도', '월', '분양가격(..

지난 글에 이어 pandas 모듈에 대해 알아봅시다 :) 14) row, column 추가 및 삭제 row의 추가 - dictionary 형태의 데이터를 만들어주고 append() 함수를 사용해서 데이터를 추가 - 반드시 ignore_index = True 옵션을 추가해서 에러가 나지 않음 df.append({'이름':'김사과','그룹':'애플','소속사':'apple','성별':'여자','생년월일':'2000-01-01','키':160,'혈액형':'A','브랜드평판지수':12345678},ignore_index=True) column의 추가 df['국적'] = '대한민국' 이런 경우에는 '국적' 이라는 새로운 컬럼을 만들어서, 이 칼럼의 모든 데이터를 일괄적으로 '대한민국'으로 입력하게 됩니다. 15)..

이전에 공부했던 numpy 와 함께 통계에 많이 쓰이는 pandas 모듈에 대해 알아봅시다 :) [pandas] - 데이터 작업을 쉽고 직관적으로 할 수 있도록 빠르고 유연한 데이터 구조를 제공하는 모듈 1) 모듈 불러오기 + 별칭 import pandas as pd 2) Series와 DataFrame - 1차원, 1개의 column은 Series라고 합니다. - 데이터프레임: 가로축, 세로축이 있는 2차원. 다양한 타입의 데이터를 저장하는 자료구조 기본적으로 Series를 만드는 방법 두 가지 pd.Series([1,2,3,4]) a = [1,2,3,4] pd.Series(a) 데이터 프레임을 만드는 방법 - 첫 번째 # DataFrame 만들기 1 product1 = [['삼성',990000, '갤..

통계할 때 자주 쓰이는 numpy 모듈을 알아봅시다 :) [Numpy] - 수학, 과학 계산용 패키지 - 성능: 파이썬의 리스트보다 빠름 - 메모리 사이즈: 파이썬의 리스트보다 작은 메모리를 사용 - 빌트인 함수: 선형함수, 통계관련 여러 함수들을 내장 1) 모듈 불러오기 import numpy numpy numpy out:::: 실행하게 되면 다른 사람이 만들어 놓은 모듈이 설치 되었다는 것을 알려줍니다. 2) 모듈 별칭 주기 # 별칭을 주자(as) import numpy as np np out:::: 별칭으로 실행하게 되어도 numpy로 실행했을 떄와 객체가 같음을 확인할 수 있습니다. 3) array(배열) - 여러 값들의 그룹 기본적으로 ndarray를 만드는 방법 arr = np.array([1..
- Total
- Today
- Yesterday
- 프론트엔드
- testing
- Python
- 머신러닝
- HTML
- 자바스크립트 기초
- 리액트
- 스타일 컴포넌트 styled-components
- jest
- rtl
- CSS
- 파이썬
- react
- TypeScript
- 자바
- 프론트엔드 기초
- 리액트 훅
- 인프런
- 데이터분석
- frontend
- 타입스크립트
- 프론트엔드 공부
- react-query
- 딥러닝
- styled-components
- JSP
- 자바스크립트
- 디프만
- next.js
- 프로젝트 회고
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |