제출한 대시보드
과제에서 요구하는 지표 이외에 나름 많은 시도를 해봤다.
전환 건수
재방문 건수
재방문율
매개변수 활용한 일별 유저수, 전환 건수
등의 워크 시트를 만들었다. 근데 위에 안 들어간 이유는 시간 내에 제대로 구현하지 못했기에...
나름 많은 시도들을 해본 것 같은데... 잘 안되는 것들이 많았다 ㅠㅠ
아래에는 과제의 소개, 목표, 그리고 제출한 워크시트와 시도해봤으나 완성시키지 못한 워크시트 등에 대해 정리해보았다.
전체적으로 축 범위가 조정되어 있으며
📍 데이터 소개
- kaggle_dataset: ab_data.csv 파일 다운
- 컬럼 설명
- user_id: 유저 아이디(약 29만명)
- timestamp: 2017-01-02 ~ 2017-01-24
- group: 대조군(control), 실험군(treatment)
- landing_page: old_page, new_page
- converted: 랜딩 페이지 전환 유무(1,0)
📍 대시보드 요구 사항
아래 요구 사항을 참고해서 대시보드를 만들어보세요!
✅ 대시보드 뷰어 프로덕트팀 구성원(Product Owner, Product Analyst, UI Designer, Software Engineer)
✅ 지표 선정 conversion rate(%): 랜딩 페이지 전환율
✅ 대시보드 구성
- 레이아웃 규격: 일반 데스크톱 모니터(1920 x 1080) - 컬러: 컬러 팔레트 자유롭게 활용
워크시트 1번 : 그룹별 유저 비중
- 마크: 파이 차트
- 색상: Group
- 각도: User Id 카운트(고유)
- 레이블: Group
- 범례뿐만 아니라 주석을 통해 그룹 분류 표시
양식은 오랑우탄님의 정리 양식 참조
워크시트 2번 : 그룹별 평균 전환율 막대 그래프
- 마크: 막대 차트
- 행 : 평균(Converted)
- 열 : Group
- 색상: Group - 사용자 지정 다중 으로 색 지정
- 레이블: 평균(Converted)
- Converted가 전환 유무(0,1)이기 때문에 해당 필드 우클릭 - 측정값 - 평균 하면 됩니다.
- 저는 Average Converted Rate(%)라는 필드를 만들어 계산식에 AVG([Converted]) * 100 를 넣었고,
- STR(ROUND([Average Converted Rate(%)], 2)) + "%" 라는 계산식을 만들어 깔끔한 레이블이 출력되도록 했습니다.
- 현업에서도 소수점 두자리 정도까지를 선호한다고 합니다.
워크시트 3번 : 일별 그룹별 평균 전환율 선 그래프
- 마크: 막대 차트
- 행 : 집계(Average Converted Rate(%))
- 열 : Timestamp 를 드랍 다운 하여(+) '일 Timestamp'만 남기고 버림
- 색상: Group - 사용자 지정 다중 으로 색 지정
- 마크 레이블 : 직접 점들을 선택하여 우클릭 - 마크 레이블 - 항상 표시 로 바꿔줬습니다.
- Group을 레이블에 넣고 레이블 - 레이블 지정할 마크 - 최대/최소 로 해줘도 됩니다.
워크시트 4번 : 그룹별 유저 고유 카운트 요일별 캘린더 차트
- 마크: 사각형
- 행 : Group, 주(Timestamp)
- 열 : Timestamp 를 드랍 다운 하고(+) '년월 Timestamp', 요일(Timestamp)만 남기고 버림
- 색상: 카운트 고유 User Id
- 레이블: 카운트 고유 User Id, 일(Timestamp)
- 깔끔하게 만들기 위해 머릿글 표시 해제
- 그룹 별 차이를 보이기 위해 워크시트 서식에서 테두리를 검은 색으로 변경
- 날짜가 나오게 하기 위해 레이블에 일(Timestamp) 추가
- 사실 이 전에는 더 캘린더처럼 보이게 하기 위해 1개의 칸에 2개의 그룹이 들어가도록 만들었고 꽤나 시각화하기에 적합했다
- 그러나 그룹이 2개이기 때문에 날짜도 2번씩 출력이 되는 문제가 발생했다. 이 문제 때문에 오랜 시간을 허비했다.
해당 과제는 다른 방식으로도 풀 수 있다.
- 위 워크시트와는 달리 축까지 표시 제거(더이상 그룹을 표시할 필요가 없기 때문)
- 행: 주(Timestamp)
- 색상: 카운트 고유 User Id
- 레이블: 카운트 고유 User Id, 일(Timestamp)
- 레이블 편집에서 서식을 변경시킬 수 있습니다. 이 워크시트만 볼 때는 유저수가 가운데 정도에 나와야 예쁘지만 대시보드에 시각화할 때는 여백, 줄바꿈 때문에 안보이는 문제가 생기기도 합니다.
- 하얀 테두리로 바꿈으로써 캘린더처럼 보이게 만들었음
- 필터에 Group을 두어 전체, 양 그룹의 일별 유저수를 오른쪽 위 필터를 통해 확인해볼 수 있도록 만들었습니다.
대시보드 : 유저 및 전환율 개요
- 제목 설정 - 왼쪽 아래 대시보드 제목 표시 '체크'
- 가로 컨테이너 생성
- 서식 - 대시보드 서식 에서 글꼴 설정 및 백그라운드 배경 설정
- 범례에 group 두번 나와서 하나는 그냥 지웠습니다.
5번 문제 : 데이터 정합성 체크 & 전처리 작업
아래 계산식으로 New User Id 필드를 새로 만들었습니다.
IF [Group] = 'control' AND [Landing Page] = 'new_page' THEN NULL
ELSEIF [Group] = 'treatment' AND [Landing Page] = 'old_page' THEN NULL
ELSE [User Id] END
근데 필터를 거는 것이 훨씬 유용한 것 같습니다...
워크시트 6번 : 도넛 차트 활용 평균 전환율 지표 만들기
도넛 차트 만드는 방법
옵션 1: 두 개의 파이 차트 사용
1단계: 파이 차트 만들기
- Tableau Desktop에서 Superstore 샘플 데이터에 연결합니다.
- 표시 에서 원형 표시 유형을 선택합니다 .
- 세그먼트를 끌어서 색칠 하세요 .
- 판매를 각도 로 드래그합니다 .
- 두 번째 Sales 사본을 Label 로 끌어다 놓습니다 .
- 원하는 대로 파이 차트 크기를 조정하세요.
2단계: 이중 축 차트로 전환
- 분석 > 계산 필드 만들기를 선택하세요
- 계산 필드 대화 상자가 열리면 다음을 수행한 다음 확인을 클릭합니다.
- 계산된 필드의 이름을 지정합니다. 이 예에서 계산된 필드의 이름은 "Dummy Axis"입니다.
- 수식 필드에 다음 수식을 입력하세요: MIN(1)
- 더미 축을 행 으로 드래그합니다 .
- 더미 축을 다시 행 으로 끌어다 놓습니다 .
- 행 에서 더미 축의 두 번째 인스턴스를 마우스 오른쪽 버튼으로 클릭한 다음 이중 축을 선택합니다 .
3단계: 두 번째 원형 차트를 원으로 변경
- Marks 카드 하단에서 AGG(Dummy Axis) (2)를 클릭합니다 .
- 색상 에서 세그먼트를 제거합니다 .
- Angle 에서 Sales를 제거합니다 .
- 색상을 클릭한 다음 배경과 같은 색상을 선택합니다. 이 예에서는 흰색을 클릭합니다.
- 크기를 클릭한 다음 슬라이더를 왼쪽으로 드래그하면 원의 크기가 작아집니다.
- 각 축을 마우스 오른쪽 버튼으로 클릭하고 머리글 표시 선택을 취소합니다 .
- 세그먼트 : Group
- 판매(Sales) : Average Converted Rate(%)
- Dummy Axis 1에서 겉의 부분에 대한 색상, 크기, 레이블을 조정하면 되고
- Dummy Axis 2에서 안의 부분(빈 공간)에 레이블을 넣으면 됩니다.
- 1, 2의 크기를 적절하게 조절하여 도넛 차트의 크기를 조정하면 됩니다.
6번에서 '다양한 지표'를 만들라고 문제를 해석해서,
등의 지표들을 만들었다.
총 전환 건수는 실제로 대시보드에 사용하였으나 오른쪽에 만들고자 했던 재방문율은 무슨 영문인지 출력이 되지 않았다.
이 문제 말고 다른 문제들에서도 너무 많은 필드를 생성하고 필드끼리 결부되어있다보니 생긴 문제 같다. 혹은 계산식이 틀렸거나.
아무튼 재방문율은 나름 쓸모있는 지표라고 생각이 든다.
물론 전환율과 관계가 있느냐는 생각을 좀 해봐야하겠지만.
워크시트 7번 : start date, end date 매개변수 필터 만들기
아 문제가 필터 만드는 거였구나... 물론 필터로 쓰긴 했는데 매개변수 자체에 초점이 있는줄 알았다..!
그리고 또 잘해보고 싶어서 여러 지표를 만들어보고자 했다.
특정 날짜의 시간 별 전환 건수
시간 별 평균 전환율
시간별 그룹별 평균 전환율
근데 생각해보니 이 차트들은 date랑은 큰 관련이 없는 지표들이어서... 근데 회사에서 사용하기엔 적합한 자료라고 생각해서 7번 과제는 아니지만 대시보드에 넣었다.
아무튼
일별 유저수
- 이 그래프도 date 매개변수 없이 만들 수 있다
- 대시보드에서 직접 날짜를 조정해가면서 유저수를 확인할 수 있다는 점에서 유용한 워크시트이다.
- 2일, 24일의 경우 24시간을 다 측정한 것이 아니기에 아래의 그래프처럼 그려진다.
- 따라서 이것을 이상치라 판단하고 대시보드에서 제거할 수도 있다.
매개변수를 만드는 법 : https://help.salesforce.com/s/articleView?id=001458218&type=1
해당 문제는 사실 주변의 도움을 많이 받았기에 완전히 이해가 되고나서 정리해야겠다!