[시계열 데이터] 02. 시계열 데이터 시각화(autoscale, WeekdayLocator, DateFormatter)
2022. 3. 12. 18:11ㆍ나혼빅(나혼자빅데이터)/시계열데이터
[시계열 데이터] 02. 시계열 데이터 시각화
(스타벅스 주식 데이터를 활용한 시계열 데이터 시각화 활용)
해당 포스팅은 Udemy(유데미)의 시계열 데이터 분석 with Python(파이썬)을 수강하면서 정리하였습니다.
01. 데이터 설명
- 캐글(Kaggle)의 스타벅스 주식 데이터 활용
- https://www.kaggle.com/hrideshkohli/starbucks
- 총 1006 row, 3 columns('Date', 'Close', 'Volume')으로 구성
- 2015년 1월 2일부터 2018년 12월 31일 까지 스타벅스 종가(Close), 거래량수(Volume)를 나타낸 시계열 데이터
- 현재 일자에 해당하는 ‘Date’ 칼럼은 object 객체 타입으로, 시계열 분석을 위해서는 ‘Datetime’ 객체로 변환시켜줘야함
02. 시계열 데이터 시각화를 위한 기초
2-1. matplotlib 활용 플롯/차트 구성
가. X축 범위, Y축 범위 지정
- X축 범위 : xlim
- y축 범위 : ylim
나. 선 굵기, 선 모양, 선 색
- 선 굵기 : lw
- 선 모양 : ls
- 선 색: c
다. X축 주눈금/보조눈금, y축 주눈금/보조눈금 설정
import matplotlib.pyplot as plt
ax = plt.axes()
- X축 주눈금 : ax.xaxis.set_major_locator
- X축 보조눈금 : ax.xaxis.set_minor_locator
- y축 주눈금 : ax.yaxis.set_major_locator
- y축 보조눈금 : ax.yaxis.set_minor_locator
- X축 주눈금을 월요일 날짜로 지정을 하고자 함
<지정 전>
<지정 후>
03. 시계열 데이터 시각화
3-1. autoscale (축 자동 스케일링)
가. autoscale
- 축 자동 스케일링 : 시각화된 데이터의 x축 혹은 y축 혹은 x,y값 모두 화면에 맞도록 자동 스케일링 함
나. autoscale 활용 예시
- autoscale 전
- < 축 자동 스케일링 autoscale 'x축만 적용'>
- < 축 자동 스케일링 autoscale 'y축만 적용'>
- < 축 자동 스케일링 autoscale 'x축, y축 모두 적용'>
3-2. 데이터 포맷팅(Data Formatting)
가. 데이터 포맷팅(Data Formatting)
- datatime을 원하는 형태의 string 타입으로 변경 `strftime 사용`
나. 필요 라이브러리 임포트
from datetime import datetime
다. 데이터 포맷팅 형식
라. 데이터 포맷팅 예시
- 2001, 2, 3, 16, 5, 6 → ‘년 월 일, 요일, 시간 형식으로’
- 데이터 포맷팅 활용 시계열 데이터 시각화
'나혼빅(나혼자빅데이터) > 시계열데이터' 카테고리의 다른 글
[시계열 데이터] 03. 시계열의 기본 특성(시계열 데이터 정의, 예제, 시계열데이터 구분, 분석 목적, 구성요소) (0) | 2022.03.17 |
---|---|
[시계열 데이터] 01. 시계열 데이터 개요(DateTime 인덱스/ 시계열을 위한 판다스 유틸리티-Resampling/rolling/expanding) with 스타벅스 주식 데이터 (0) | 2022.03.11 |