티스토리 뷰
오늘은 전처리 과정 중에서도 이벤트 순서를 정리하는 코드와 transactions 테이블을 따로 만드는 작업을 진행했다.
이 두 작업은 이후 오퍼 반응 분석과 실제 구매 분석을 분리해서 보기 위해 꼭 필요한 단계였다.
이벤트를 정리하면서 오퍼 반응과 실제 구매를 같은 흐름으로 보면 안 된다는 점도 다시 확인했다. received, viewed, completed는 오퍼 반응 퍼널을 보기 위한 이벤트이고, transaction은 실제 결제를 의미한다. 따라서 이후 분석에서는 오퍼 반응 데이터와 구매 데이터를 분리해서 다뤄야 한다는 기준을 더 분명히 잡을 수 있었다.
그다음에는 transaction 이벤트만 따로 분리해서 transactions 테이블을 만들었다. 원본 로그 데이터에는 오퍼 관련 이벤트와 실제 구매 이벤트가 모두 섞여 있기 때문에, 전체 테이블만 그대로 두면 구매 분석을 할 때 불필요한 이벤트까지 함께 들어오게 된다. 그래서 event == 'transaction' 조건으로 실제 구매 데이터만 따로 추출해 거래 분석용 테이블을 만들었다.
이 transactions 테이블에서는 고객별 구매 금액, 거래 횟수, 총매출, 객단가 같은 지표를 계산할 수 있는 기반을 마련했다. 즉, 이후 고객 구매 행동 분석이나 매출 KPI 계산은 이 테이블을 중심으로 진행할 수 있게 된 것이다. 오퍼 퍼널 분석은 전체 이벤트 테이블에서, 매출 분석은 transactions 테이블에서 진행하는 구조가 더 명확하다고 느꼈다.
오늘 작업은 양이 많지는 않았지만, 분석 흐름을 정리하는 데 중요한 단계였다. 이벤트 순서를 통일하고 transaction 데이터를 별도 테이블로 분리하면서, 앞으로는 오퍼 반응 분석과 실제 구매 분석을 각각 더 깔끔하게 진행할 수 있을 것 같다.
'내일배움캠프 데이터 분석' 카테고리의 다른 글
| 66일차) 내일배움캠프 데이터 분석 TIL - 실전 프로젝트(10), 밍글데이 (0) | 2026.03.31 |
|---|---|
| 63일차) 내일배움캠프 데이터 분석 TIL - 실전 프로젝트(7) (0) | 2026.03.26 |
| 61일차) 내일배움캠프 데이터 분석 TIL - 실전 프로젝트(5) (0) | 2026.03.24 |
| 60일차) 내일배움캠프 데이터 분석 TIL - 실전 프로젝트(4) (0) | 2026.03.23 |
| 59일차) 내일배움캠프 데이터 분석 TIL - 실전 프로젝트(3) (0) | 2026.03.20 |
- Total
- Today
- Yesterday
- 내일배움캠프
- GoogleColab
- 비전공자코딩
- Python
- 머신러닝
- 파이썬입문
- git
- 데이터분석입문
- 태블로
- 판다스
- github
- 코딩처음
- 프로그래밍입문
- Til
- 코딩기초
- 통계
- 텍스트분석
- 파이썬
- 구글코랩
- 코드카타
- 데이터분석
- Tableau
- 데이터시각화
- 중학생코딩
- SQL
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | |||||
| 3 | 4 | 5 | 6 | 7 | 8 | 9 |
| 10 | 11 | 12 | 13 | 14 | 15 | 16 |
| 17 | 18 | 19 | 20 | 21 | 22 | 23 |
| 24 | 25 | 26 | 27 | 28 | 29 | 30 |
| 31 |
