Home
Soondong
Cancel

시간 윈도우 롤링 - 희소 데이터와 시간 윈도우 롤링

희소 데이터와 시간 윈도우 롤링 date_dim 데이터를 살펴보자. SELECT * FROM date_dim date_dim 테이블의 날짜 컬럼인 date 범위는 다음과 같다. SELECT MIN(date), MAX(date) FROM date_dim retail_sales 테이블에서 Women store와 1월 7월에 해당하는 날짜...

트렌드 분석 - 시계열 데이터 변화 이해를 위한 인덱싱

WITH vs Subquery 문득 궁금해서 아래 쿼리를 서브쿼리와 WITH 구문을 이용하여 실행해보니 다음과 같은 실행 시간이 소요됐다. 따라서 FROM절에 서브쿼리를 많이 사용하거나 긴 쿼리를 작성하게 된다면 소요되는 시간이나 눈으로 보기에 복잡할 수 있으므로 WITH를 사용한다. WITH : 00:00:00.397 서브쿼리 : 00:0...

시간 윈도우 롤링 - 롤링 계산

쿼리 뜯어보기 해당 쿼리 또한 헷갈려서 과정을 하나씩 이해해보려고 했다. retail_sales 테이블을 SELF JOIN한다. JOIN 조건은 kind_of_business가 같아야 한다. (다른 컬럼들의 값은 일치하지 않는다는 것에 주의) B.sales_month BETWEEN A.sales_month - interval '11 m...

트렌드 분석 - 전체 대비 비율

날짜별 매출 비율 날짜별 매점별 매출 비율에 대해서 알아보자. 중간 과정이 살짝쿵 헷갈려져서 쿼리를 뜯어보았다. 아래는 내가 이해해가는 과정이다. 틀린 부분이 있다면 피드백을 남겨주세요! [서브쿼리] 동일한 retail_sales 테이블을 SELF JOIN 한다. JOIN 기준은 sales_month(날짜)가 같은 기준으로 한다. ...

트렌드 분석 - 요소 비교

요소 비교 연도와 비즈니스 종류에 따라 그루핑한 후 서점, 굿즈, 취미 및 게임 상점에 해당하는 값들의 연도, 종류, 매출의 합계를 살펴본다. SELECT DATE_PART('year', sales_month) AS sales_year, kind_of_business, SUM(sales) AS sales FROM retail_sales WHER...

트렌드 분석 - 간단한 트렌드

간단한 트렌드 분석 앞서 생성한 retail_sales 테이블을 활용하여 분석한다. 비즈니스 종류가 Retail and food services sales, total인 경우의 sales_month 컬럼만 조회한다. SELECT sales_month FROM retail_sales WHERE kind_of_business = 'Retail and ...

Time series dataset 준비

csv 파일 다운로드 us_retail_sales.csv 파일을 다운로드 받는다. 파일 생성 pdAdmin 4 프로그램을 실행하여 테이블을 생성한다. retail_sales 테이블을 생성하고, 다운 받은 데이터 파일의 값들을 복사하여 집어 넣는다. -- retail_sales 테이블이 존재하지 않는다면 테이블을 생성한다. DROP table if ...

PostgreSQL 설치 및 실행

PostgreSQL 설치 아래 사이트에서 본인의 운영체제에 맞는 PostgreSQL을 다운로드하여 설치한다. https://www.enterprisedb.com/downloads/postgres-postgresql-downloads 위 경우만 사진과 같은 상태로 설정하였고, 나머지는 모두 기본값으로 설정하여 Next를 눌러 진행하였다. 비...

[MySQL] Python으로 MySQL 연결하기

설치 및 연결 pip install PyMySQL import pymysql db = pymysql.connect( user='root', passwd='비밀번호', host='127.0.0.1', port=3306, db='데이터베이스', charset='utf8' ) 위 코드를 실행하다가 여러가지 ...