본문 바로가기
  • 공부한 것들과 여러가지를 기록해요

SQL17

[프로그래머스] SQL lv4 자동차 대여 기록 별 대여 금액 구하기 Table 소개 , 편의상 1번 2번 3번 테이블1번 테이블 : CAR_RENTAL_COMPANY_CAR : 대여 중인 자동차들의 정보 자동차 종류는 '세단', 'SUV', '승합차', '트럭', '리무진' 이 있습니다. 자동차 옵션 리스트는 콤마(',')로 구분된 키워드 리스트(예: ''열선시트,스마트키,주차감지센서'')로 되어있으며, 키워드 종류는 '주차감지센서', '스마트키', '네비게이션', '통풍시트', '열선시트', '후방카메라', '가죽시트' 가 있습니다. 2번 테이블 : CAR_RENTAL_COMPANY_RENTAL_HISTORY : 자동차 대여 기록 정보 3번 테이블 : CAR_RENTAL_COMPANY_DISCOUNT_PLAN : 자동차 종류 별 대여 기간 종류 별 할인 정책 정보 할인.. 2024. 1. 8.
프로그래머스 SQL Lv 3. ~ 5 정주행 문제 풀면서 느낀점들, 알게 된 것들, 나중에 리마인드하면 좋은 것들을 기록해두고자 한다제가 보려고 적는 거라서 편하게 적어보겠습니다 DATEDIFF(END, START) datediff(단위,시작,끝) +1 해줘야되는 경우 있음 DATE_FORMAT(날짜, '%Y-%m-%d') 2022년 9월 데이터를 찾는다면? year(date) , month(date) 하지말고 date like '2022-09%'  아니면 SUBSTR(ING)(DATE,1,7) = '2022-09' group 전 조건은 where group 후 조건은 having A테이블에서 B테이블에 없는 애들 추출 A 기준으로 left조인 후, B테이블의 컬럼 값이 null인 거 찾으면 됨 테이블 합치기는 무조건 JOIN? no.  union.. 2024. 1. 2.
[데이터 분석을 위한 SQL 레시피] 19강 - 데이터 중복 검출하기 RDB는 적절하게 유니크 키를 설정한다면, 키가 중복되었을 때 자동으로 오류가 발생하여 데이터 무결성이 보장됨 하지만 RDB가 아닌 데이터베이스(Hive, BigQuery)에서는 중복을 사전에 확인하는 기능이 없음 데이터가 많으면 중복을 눈으로 하나하나 확인하는 건 불가능하기 때문에, 중복 데이터 확인 및 제외 방법을 알아야함 1. 마스터 데이터의 중복 검출하기 - 마스터 데이터에 중복이 존재한다면? : 마스터 데이터를 로그 데이터와 결합할 때 로그가 여러 레코드로 카운팅 되어 결과가 이상해짐 몇가지 이유 - 데이터 로드할 때 여러번 로드한 경우 - 마스터 데이터를 갱신할 때, 오래된 데이터와 새로운 데이터가 서로 다른 레코드로 분리된 경우 - 운용상의 실수로 같은 ID를 다른 데이터에 재사용한 경우 -.. 2023. 11. 20.
[데이터 분석을 위한 SQL 레시피] 15강 - 사이트 내의 사용자 행동 파악하기 웹사이트에서의 특징적인 지표 - 방문자 수 - 방문 횟수 - 직귀율 - 이탈률 1. 입구 페이지와 출구 페이지 파악하기 입구 페이지 - 사이트 방문했을 때 처음 접근한 페이지(랜딩 페이지) 출구 페이지 - 마지막으로 접근한 페이지(이탈 페이지) 코드 15-1 - FIRST_VALUE, LAST_VALUE : 첫번째 값을 가져오기 ex) FIRST_VALUE(path) : path열의 첫번째 값으로 landing 열을 구성 - partition by - rows between unbounded preceding(처음), following(끝) 코드 15-2 입구,출구 페이지의 방문횟수 집계 어떤 페이지에서 조회하기 시작해서 어디서 이탈하는지도 파악해야됨! 코드 15-3 세션별로 입구 페이지와 출구 페이지의.. 2023. 11. 6.
[데이터 분석을 위한 SQL 레시피] 12강 - 시계열에 따른 사용자 전체의 상태 변화 찾기 사용자는 서비스 사용 시작일로부터 시간이 지나면 상태 변화가 일어남 - 충성도 높은 사용자로 성장 - 사용을 중지 - 가입은 되어 있지만 사용하지 않는 상태(휴면) 서비스 운영자 입장에서는? - 사용자가 계속해서 사용하도록 해야함 -> 사용자가 어느 정도 계속해서 사용하는 지 파악 -> 사용자의 서비스 사용을 시계열로 수치화하고 변화를 시각화 - 휴면 사용자를 어떻게 하면 다시 사용하게 만들지 생각 - >메일 매거진/CM/광고 - 완전 탈퇴 사용자는 대책을 적용하기 어려움 1. 등록 수의 추이와 경향 보기 - 사용자 등록이 필요한 서비스에서 등록 수는 중요한 지표 등록자 감소 경향 -> 서비스 활성화하기 어려워짐 등록자 증가 경향 -> 사용자가 서비스에서 이탈할지 아닐지를 분석해서 서비스 활성화와 연결해.. 2023. 10. 7.
[데이터 분석을 위한 SQL 레시피] 11강 - 사용자 전체의 특징과 경향 찾기 사용자를 위한 서비스를 제공할 때 사용자와 관련된 정보로 알고 싶은 것은?- 사용자의 속성(나이, 성별, 주소) : 마스터 테이블- 사용자의 행동(구매 상품, 빈도) : 액션 로그 테이블 어떤 속성의 사용자가 사용하는지 or 사용자가 어떻게 사용하는 지 알 수 있어야 함  1. 사용자의 액션 수 집계하기UU : Unique User, 중복 없이 집계된 사용자 수사용률(usage_Rate) : 특정 액션 UU를 전체 액션 UU로 나눈 것 with stats as( select count(distinct session) as total_uu from action_log)select l.action ,count(distinct l.session) as action_uu ,count(*) as action_co.. 2023. 10. 2.