본문 바로가기

분류 전체보기

(108)
시계열 데이터 분석, 예측하기 라이브러리 설치하기 pip install pmdarima ➞ R에서 실행되는 auto.arima를 파이썬에서 실행시킬수 있도록 설계된 통계 라이브러리 ➞ 시계열 데이터를 분석할때 좋음 라이브러리 불러오기 import os import requests from io immport BytesIO from itertools import product from datetime import datetime # 데이터 처리 import pandas as pd import numpy as np # 시각화 import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.ticker as plticker import seaborn as sns # 분석..
데이터 분석 라이브러리 불러오기 import os # 데이터 처리 import pandas as pd import numpy as np # 시각화 import matplotlib.pyplot as plt import matplotlib.ticker as plticker import seaborn as sns # 분석 import statsmodels.api as sm import scipy # 그래프 글꼴 설정 plt.rc('axes', unicode_minus=False) plt.rc('font', family='NanumBarunGothic') 파일 불러오기 file_path_data = os.getenv('주소') data = pd.read_csv(file_path_data) EDA(Exploratory Dat..
머신러닝 모델설계하기 기초 | 내가 받을 팁 예측하기 (2) seaborn 패키지에서 제고하는 데이터를 가지고 내가 받을 수 있는 팁이 얼마인지 간단히 예측하는 모델을 설계해 보도록 하겠습니다. 먼저 데이터를 불러오도록 하겠습니다. import seaborn as sns tips = sns.load_dataset('tips') tips.head() 먼저 string형태의 데이터를 원-핫 인코딩으로 변환하여 실수형 으로 바꿔주겠습니다. 데이터의 형태를 바꿔주는 이유는 수식에 넣어 계산 할것이기 때문입니다. import pandas as pd tips = pd.get_dummies(tips, columns = ['sex', 'smoker', 'day', 'time']) tips.head() # col의 순서 바꾸기 tips = tips[['total_bill', 's..
머신러닝 모델설계하기 기초(1) 더보기 모듈 import from IPython.display import display, Image import pandas as pd import matplotlib.pyplot as plt %matplotlib inline %config InlineBackend.figure_format = 'retina' # 더 높은 해상도로 출력 데이터 - 맥북 데이터 셋 - 맥북을 사용한 사용연수와 중고가격을 나태내는데이터 먼저 데이터를 확인해 보겠습니다. macbook = pd.read_scv('주소') print(macbook.shape) macbook.head() 맥북데이터셋에서는 사용연수를 가지고 중고가격을 측정하였지만 사실 노트북 중고가격을 결정하는 요소들은 CPU, 배터리 수명, 외관 등 다용한 요소..