티스토리 뷰
1. 리텐션의 두 가지 의미 구분
- 개념으로서의 리텐션: 고객을 유지하기 위한 전반적인 활동
- 지표로서의 리텐션: 전체 유저 중 재방문한 유저의 비율 (≈ 재방문율)
리텐션이라는 단어가 맥락에 따라 다르게 쓰이므로, 발표나 문서 작성 시 어떤 의미로 쓰는지 명확히 해야 한다
2. 리텐션 측정 3가지 방법
- N-day 리텐션 (클래식): 정확히 N일째에 재방문한 유저만 카운트
- 직관적이고 깔끔하지만, 사용 주기가 일별이 아닌 앱에는 맞지 않음
- Unbounded 리텐션 (롤링): N일 이후에라도 재방문한 유저를 N일에도 남은 것으로 간주
- 이탈하지 않은 유저 수를 계산하는 방식 → 측정 시점에 따라 값이 크게 달라지는 단점
- Bracket 리텐션: N-day를 특정 구간(예: 3일 단위)으로 묶어서 계산
- 사용 주기가 주 단위, 월 단위인 앱에 적합
어떤 리텐션 방식을 쓸지는 앱의 사용 주기와 비즈니스 목표에 따라 결정해야 한다. 하나의 정답이 없다
3. Engagment와 트리거
- 외부 트리거: 푸시 알림, 이메일 등 외부 자극으로 앱 사용 유도 (예: 장바구니 알림, 슬랙 초대 메일)
- 내부 트리거: 심심함, 소통 욕구 등 심리적 요인으로 앱을 자발적으로 사용하게 만드는 요소
- 내부 트리거에 의해 유저가 앱을 쓰는 것이 회사 입장에서 더 이상적
좋은 앱은 외부 트리거 없이도 유저가 자연스럽게 돌아오게 만든다. 이 관점으로 온보딩·아하 모먼트 설계를 봐야 한다
4. Stickiness(밀착도)와 파워 유저 곡선
- Stickiness: DAU / MAU → 월 활성 유저 중 일 활성 유저 비율. 앱을 얼마나 자주 쓰는지 측정
- ⚠️ 이커머스는 밀착도만 보면 안 됨 → 구매 전환까지 같이 봐야 실질적 의미가 있음
- 파워 유저 곡선: X축 = 한 달 동안 접속한 일수, Y축 = 해당 유저 비율
- U자(스마일) 곡선이 건강한 앱의 지표 → 맨날 들어오는 파워 유저 비율이 높다는 의미
- SNS는 오른쪽에 치우치고, 이커머스는 중간에 분포하는 것이 자연스러움
앱 성격에 따라 이상적인 곡선 모양이 다르다. 무조건 오른쪽으로 쏠려야 좋은 게 아님
5. 코호트 3가지 종류
- 유입 코호트: 가입 시기별로 유저를 그룹핑 (예: 2022년 3월 가입자 vs 4월 가입자)
- 행동 코호트: 특정 이벤트 수행 여부/횟수로 그룹핑 (예: 첫 세션 체류 시간 0~5초, 6~47초, 48~99초, 100초 이상)
- 라이프사이클 코호트: 특정 시점 기준 유저 상태로 구분 (신규 / 기존 / 복귀 / 휴면)
- CRM 마케팅에서도 동일한 개념을 사용하며, 각 그룹에 따라 마케팅 전략이 달라짐
코호트는 그냥 '그룹'인데, 어떤 기준으로 나누느냐가 분석의 핵심이다
6. 코호트 차트 해석 방법
- X축: 가입 시점으로부터 경과한 월수 (또는 주수)
- Y축: 가입 시점 (가입 월 또는 주)
- 셀 값: 해당 가입 코호트에서 N개월 뒤 남은 유저 비율
- 대각선: 동일한 달(또는 주)을 의미 → 대각선으로 비교하면 특정 시점의 문제인지, 특정 코호트의 문제인지 구별 가능
- 대각선 전체가 낮으면 → 해당 시점의 문제 (서비스 장애, 버그 등)
- 해당 코호트만 낮으면 → 해당 그룹 문제 (타겟 오류, 잘못된 유입 채널)
이상치를 발견했을 때 대각선으로 먼저 시점 문제를 체크해야 한다
7. Tableau 실습 포인트
- 채널별 리텐션 커브: FIXED 함수에 채널 그룹핑을 추가해 채널별 분모를 각각 계산
- 결과: 디스플레이 채널이 초기 리텐션 가장 높음, 레퍼럴(친구 추천)이 장기 리텐션 가장 높음
- 유입 코호트별 리텐션 커브: FIXED에 MONTH(유저별 최초방문일) 추가
- 색상에 최초방문일(월, 불연속형) 올려서 가입 월별 비교
- 결과: 2017년 5월 가입자가 초기 리텐션 최고, 2016년 8월 가입자가 장기 리텐션 최고
- 코호트 차트: 행에 최초방문일(주 번호, 불연속형), 열에 경과 주차(불연속형)
- 텍스트에 Full Visitor ID(카운트 고유) → 퀵 테이블 계산 > 구성원 비율로 %화
- 색상 편집에서 끝값 0.06으로 조정해 색상 범위 최적화
- 행동 코호트별 리텐션 커브: 첫 세션 체류 시간(Time on Site)으로 구간 설정 후 그룹핑
- 100초 이상 체류 유저의 리텐션이 5.6%로 가장 높고, 체류 시간이 짧을수록 낮아짐
FIXED 함수에서 그룹핑 기준만 바꾸면 동일한 리텐션 로직으로 다양한 코호트 분석이 가능하다
'내일배움캠프 데이터 분석' 카테고리의 다른 글
| 71일차) 내일배움캠프 데이터 분석 TIL - 밍글데이(2) (0) | 2026.04.07 |
|---|---|
| 70일차) 내일배움캠프 데이터 분석 TIL - Streamlit(2) (0) | 2026.04.06 |
| 68일차) 내일배움캠프 데이터 분석 TIL - 이커머스(2) (1) | 2026.04.02 |
| 67일차) 내일배움캠프 데이터 분석 TIL - 이커머스(1) (0) | 2026.04.01 |
| 66일차) 내일배움캠프 데이터 분석 TIL - 실전 프로젝트(10), 밍글데이 (0) | 2026.03.31 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 통계
- 비전공자코딩
- 프로그래밍입문
- 머신러닝
- 중학생코딩
- 코딩처음
- SQL
- 데이터분석입문
- 파이썬입문
- 텍스트분석
- Til
- 코드카타
- 데이터분석
- 구글코랩
- 태블로
- github
- Python
- 데이터시각화
- 내일배움캠프
- Tableau
- git
- 파이썬
- 판다스
- GoogleColab
- 코딩기초
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
글 보관함
