데이터 분석가가 반드시 알아야 할 핵심 지표 완전정복
이 글은 데이터 분석 직무를 준비하거나, 처음으로 지표를 체계적으로 정리하고 싶은 분들을 위해 작성됐습니다.
사전적 정의가 아니라 “왜 이 지표가 필요한가” 와 “분석가는 이 지표로 무엇을 하는가” 에 집중합니다.
지표를 왜 AARRR 순서로 봐야 하는가
지표가 너무 많아서 뭐부터 봐야 할지 막막하다면, 가장 먼저 퍼널 구조를 머릿속에 심어야 합니다.
Acquisition"]) -->|42%| B(["⚡ 활성화
Activation"]) B -->|55%| C(["🔄 유지
Retention"]) C -->|37%| D(["💰 수익
Revenue"]) D -->|38%| E(["📢 추천
Referral"]) style A fill:#1e3a5f,stroke:#58A6FF,color:#F0F6FC style B fill:#1a3d2e,stroke:#3FB950,color:#F0F6FC style C fill:#2d2a1e,stroke:#E3B341,color:#F0F6FC style D fill:#3d2a1a,stroke:#F0883E,color:#F0F6FC style E fill:#2e1a3d,stroke:#BC8CFF,color:#F0F6FC
각 단계 사이의 숫자가 전환율(Conversion Rate) 입니다. 분석가의 일은 “어느 단계에서 사람이 가장 많이 빠져나가는가”를 찾아내는 것입니다.
1. 리텐션(Retention) — 분석가가 가장 먼저 보는 지표
“한 번 온 사람이 다시 오는가?”
리텐션은 단순하게 들리지만, 측정 방식에 따라 완전히 다른 이야기를 합니다.
Classic Retention vs Rolling Retention
정의: 가입 후 정확히 N일째에 돌아온 비율
가입 후 7일째 날에만 들어온 사람 / 전체 가입자
적합한 서비스: 게임, 메신저, SNS
단점: 6일째 들어왔다가 8일째 들어온 사람은 0%로 계산됨
정의: 가입 후 N일 이후 한 번이라도 돌아온 비율
가입 후 7일 이후에 한 번이라도 방문한 사람 / 전체 가입자
적합한 서비스: 여행 앱, 가전 쇼핑몰
장점: 비정기적으로 쓰는 서비스에 더 현실적인 측정값
Cohort 분석 — 리텐션의 진짜 패턴을 읽는 법
단순한 리텐션 수치 하나보다, 가입 시점이 같은 집단(Cohort) 을 묶어서 비교할 때 진짜 인사이트가 나옵니다.
Cohort Heatmap에서 읽어야 할 패턴 두 가지:
- 세로(같은 Week) 방향으로 읽기: 아래 코호트로 갈수록 Week 1 리텐션이 45% → 61%로 올라가고 있다면, 서비스 품질이 개선되고 있다는 신호입니다.
- 가로(같은 코호트) 방향으로 읽기: 특정 Week에서 리텐션이 급격히 꺾이는 시점이 있다면, 그 시점에 사용자가 이탈하는 원인이 있습니다. 그 지점을 파야 합니다.
Stickiness — DAU/MAU로 서비스 생활화 진단
\[\text{Stickiness} = \frac{DAU}{MAU} \times 100\]| 범위 | 의미 | 예시 |
|---|---|---|
| < 20% | 생활화 약함 | 핵심 기능 재점검 필요 |
| 20 ~ 30% | 준수 | 꾸준한 개선 필요 |
| 30 ~ 50% | 좋음 | 습관적 사용 중 |
| > 50% | 탁월 | 카카오톡·인스타그램 수준 |
2. 전환율(CVR) — 퍼널의 어디가 막혔나
“원하는 행동을 했는가?”
전환율은 Micro(작은 전환)와 Macro(최종 전환)로 나뉩니다.
# 세그먼트별 전환율 분석
segment_data = {
'segment': ['신규_모바일', '신규_웹', '기존_모바일', '기존_웹'],
'visitors': [15000, 8000, 22000, 12000],
'conversions': [ 300, 280, 1540, 960]
}
df = pd.DataFrame(segment_data)
df['cvr'] = (df['conversions'] / df['visitors'] * 100).round(2)
# segment visitors conversions cvr
# 신규_모바일 15000 300 2.00 ← 문제 구간 발견
# 신규_웹 8000 280 3.50
# 기존_모바일 22000 1540 7.00
# 기존_웹 12000 960 8.00
신규 모바일(2%) vs 기존 웹(8%) 사이에 4배 차이. 전체 평균만 봤다면 이 격차를 완전히 놓쳤을 것입니다.
3. 수익 지표 — LTV / CAC / ARPU / ARPPU
“비즈니스가 지속 가능한가?”
LTV — 한 명의 고객이 가져다주는 총 가치
\[\text{LTV} = ARPU \times \frac{1}{\text{Churn Rate}}\]월 평균 결제액이 3만 원이고 월 이탈률이 5%라면:
\[\text{LTV} = 30{,}000 \times \frac{1}{0.05} = 600{,}000\text{원}\]LTV / CAC — 비즈니스 지속가능성의 핵심 비율
단순히 비율만 볼 게 아니라 Payback Period(투자 회수 기간)도 함께 봐야 합니다. CAC가 LTV의 1/3이라도, 그걸 회수하는 데 24개월 걸린다면 현금 흐름에 문제가 생깁니다.
ARPU vs ARPPU — 결제 유저와 전체 유저를 구분하는 이유
전체 유저 1인당 평균 매출
총 매출 ÷ 전체 MAU
비결제 유저까지 포함해 서비스 전체의 수익 효율을 봄
결제 유저 1인당 평균 매출
총 매출 ÷ 결제 유저 수
실제 지갑을 여는 사람들의 소비 패턴을 봄. 가격 전략에 직접 영향
4. A/B 테스트 — 진짜 효과였는지 증명하는 법
“어떤 변화가 우연이 아닌 진짜 효과였는가?”
알아야 할 핵심 개념 3가지
-
Statistical Significance (통계적 유의성)
실험 결과가 우연이 아님을 증명하는 성질. 보통 p-value < 0.05일 때 "유의하다"고 판단합니다. -
P-value
귀무가설(아무 효과 없음)이 참일 때 이런 결과가 우연히 나올 확률. 낮을수록 "이건 진짜 효과다"라고 말할 수 있습니다. -
MDE (Minimum Detectable Effect)
실험으로 감지하고 싶은 최소한의 지표 개선 폭. MDE가 작을수록 더 많은 샘플(사용자)이 필요합니다. 실험 설계 단계에서 반드시 정해야 합니다.
- $z_{\alpha/2} = 1.96$ (유의수준 5%)
- $z_{\beta} = 0.84$ (검정력 80%)
- $p$ = 기존 전환율, $MDE$ = 감지하려는 최소 개선폭
5. 분석가가 지표를 다루는 실전 원칙
🌟 North Star Metric 먼저 정하라
모든 지표를 동시에 관리하는 것은 불가능합니다. 서비스의 핵심 가치를 가장 잘 표현하는 단 하나의 지표를 정하고, 팀 전체가 그것을 기준으로 정렬해야 합니다.
| 서비스 유형 | North Star Metric 예시 |
|---|---|
| 커머스 | 월간 구매 완료 건수 |
| SaaS | 주간 활성 워크스페이스 수 |
| 콘텐츠 | 주간 총 시청 시간 |
| 커뮤니티 | 월간 콘텐츠 생산 사용자 수 |
총 가입자 수, 누적 다운로드 수처럼 숫자는 커 보이지만 실제 비즈니스 상태를 반영하지 못하는 지표들입니다. 가입자 100만 명이라도 MAU가 1만 명이면 의미가 없습니다.
"전체 리텐션 25%"는 아무 말도 하지 않습니다. 신규 vs 기존, 모바일 vs 웹, 채널별, 지역별로 분해했을 때 진짜 개선 포인트가 보입니다.
전체 지표 한눈에 정리
| 분류 | 지표명 | 핵심 질문 | 주의할 것 |
|---|---|---|---|
| Retention | N-Day / Rolling / Cohort | 다시 돌아오는가? | 서비스 특성에 맞는 방식 선택 |
| Stickiness | DAU/MAU | 생활화됐는가? | 20% 미만이면 핵심 기능 재검토 |
| CVR | Micro/Macro Conversion Rate | 원하는 행동을 했는가? | 세그먼트 없는 전체 수치는 의미 없음 |
| Revenue | LTV / CAC / ARPU / ARPPU | 지속 가능한 구조인가? | LTV/CAC 비율 + Payback Period 함께 볼 것 |
| Experiment | p-value / MDE / Significance | 이 변화는 진짜 효과인가? | Peeking Problem — 조기 종료 금지 |
마치며
지표는 정답을 알려주지 않습니다.
“지금 무엇을 물어봐야 하는지” 를 알려주는 도구입니다.
리텐션이 낮으면 “왜 떠나는가”를, LTV/CAC가 1 미만이면 “이 채널에 계속 돈을 써야 하는가”를, A/B 테스트 결과가 p < 0.05이면 “이 변화를 전체 배포해도 되는가”를 물어볼 수 있게 됩니다.
댓글남기기