본문 바로가기
  • 공부 기록 인생 기록
SQL/[책] 데이터 분석을 위한 SQL 레시피

[데이터 분석을 위한 SQL 레시피] 15강 - 사이트 내의 사용자 행동 파악하기

by 티권 2023. 11. 6.

웹사이트에서의 특징적인 지표

- 방문자 수

- 방문 횟수

- 직귀율

- 이탈률


1. 입구 페이지와 출구 페이지 파악하기

입구 페이지 - 사이트 방문했을 때 처음 접근한 페이지(랜딩 페이지)

출구 페이지 - 마지막으로 접근한 페이지(이탈 페이지)

 

코드 15-1

- FIRST_VALUE, LAST_VALUE : 첫번째 값을 가져오기

ex) FIRST_VALUE(path) : path열의 첫번째 값으로 landing 열을 구성

- partition by

- rows between unbounded preceding(처음), following(끝)

 

코드 15-2

입구,출구 페이지의 방문횟수 집계

 

어떤 페이지에서 조회하기 시작해서 어디서 이탈하는지도 파악해야됨!

 

코드 15-3

세션별로 입구 페이지와 출구 페이지의 조합을 집계하는 쿼리


2. 이탈률과 직귀율 계산하기

출구 페이지 -> 이탈률을 계산해야함.

 

이탈률 = 출구수 / 페이지뷰

: 페이지를 본 횟수(페이지뷰), 나간 횟수

- 나간 횟수 = 출구수 (?)

- 단순히 높다고 안좋은 건 아님

- 만족해서 나갔을 수도 있음.

 

직귀율 = 직귀 수 / 입구수

: 특정 페이지만 조회하고 곧바로 이탈한 비율

-> 성과로 이어지지 않을 가능성이 높음

ex) 광고 사이트는 여러 페이지를 조회해야함

 

직귀율이 높은 원인

- 연관 기사 또는 상품으로 사용자를 이동시키는 모듈이 기능하지 않음

- 사용자가 만족 X

- 이동이 복잡해서

 

* 컴퓨터 전용 사이트와 스마트폰 전용 사이트가 개별적으로 존재하는 경우 따로따로 집계해봐라

-> 콘텐츠 or 콘텐츠 배치에 차이가 있을 수 있음

-> 뭔가 이거 중요한 것 같음. 저번 시간에도 막판에 적혀 있음


3. 성과로 이어지는 페이지 파악하기

성과랑 관계 없는 페이지로만 사용자가 유도되는 건 의미 X

성과랑 직결되는 페이지로 유도해야 됨

ex) 성과에 이르는 비율이 적은 기능이 있다면 아래로 내리고 다른 걸 올리거나,, 삭제 하거나,,

 

조회수로만으로 판단하면 안됨

조회수랑 성과는 별개의 문제

조회수가 낮은데 성과랑 직결되는 비율이 높다면 그 페이지는 중요한 페이지

 

CVR = 액션 / 클릭수 * 100

CVR 향상 시키기 -> 성과 good

 

코드 15-6

- path = '/complete' : 완료화면에 도달했다면 즉 성과가 있다면

- 세션별로 처음행부터 현재 행까지