코호트 분석 (Cohort Analysis)

코호트 분석

동질의 세그먼트 중에서 유사한 경험을 한 그룹을 코호트(Cohort)라고 합니다. 흔히 동일한 사회적 경험을 한 그룹이라고 말하기도하는데 동일한 시기에 온라인 매장에 최초 또는다시 접속한 고객 군을 말하기도 합니다.

동일한 시기인 이유는 동일한 시기에 온 사람이면 온라인 사이트에서 진행하는 프로모션 이벤트들 중에서 동일한 것을 보고 왔을 가능성이 크기 때문입니다.  20% 할인행사라든가 1년 동안 10% 할인은 해준다거나 특정 상품을 반값에 해준다거나 하는 행사들입니다.

이렇게 특정 프로모션을 사회적 경험으로 볼 수 있고 각각의 프로모션 이벤트를 통해서 들어온 그룹들은 각각의 특성을 가질 가능성이 큽니다. 사이트에 계속해서 방문한다거나 처음만 접속해서 가입하고 물건을 구매한 뒤에 그 뒤로는 오지 않는다거나 하는 것입니다.

그런 그룹들의 행태를 지켜보다가 향후에 이벤트를 할 때 효과가 좋은 이벤트를 다시  한다거나 이탈률이 높은 그룹에 프로모션을 다시 한다거나 해서 재방문 고객들을 계속 유지해서 비즈니스의 매출을 유지하는 방식으로 이용합니다.

조금 어렵게 말하면 코호트 분석은 서비스 또는 어떤 비지니스에서 중요한 볼륨(양적) 지표의 수치가 증가함에도 불구하고 리키버킷(고객이 새는것)을 관리하지 못해 주 수익이 증가하지 않는 것에 대한 이유등을 분석하기 위한 방법으로 잘 알려져 있습니다.
물론 그 외에도 여러가지를 볼 수 있습니다. 마켓분석에서 쉽게 볼 수 있는 분석 방법이며 특히 고객이탈방지 분석(Churn Analysis)에 사용할 수 있는 분석 방법 중에서 가장 잘 알려진 것 입니다.

코호트 분석 도표화 및 시각화

코호트 분석은 주로 스프레드시트(spread sheet) 표와 다층 케이크 차트를 이용합니다.

Image

엑셀로 하는 코호트 분석입니다.
데이터는 연습용 데이터입니다.
보는 방법은 위에서 아래로 왼쪽에서 오른쪽으로 보는 것이고 진행월별 유지 고객과 유지 비율등을 봅니다.
이외에도 월간지속매출?을 보는 표와 이탈 고객등에 표도 그려주는 것이 좋습니다.
각 표별 시각화는 엑셀로 그려도 되지만 R로 작성된 시각화가 보기 좋으므로 R로 그리는 것이 좋습니다.

Image

R로 시각화한 다층 케이크 (Layer-Cake) 차트입니다.
데이터는 위 엑셀장표의 데이터와는 다른 것을 플로팅한 것으로 단순한 시뮬레이션 데이터입니다.
차트의 꼭대기 부분은 전체 고객들의 수가 됩니다.
각 계층(색으로 구분된 층)은 진입한 월별 고객들의 숫자입니다.
진입하고 첫달에 이탈하는 경우가 많은 것을 알 수 있습니다.
ARPU와 MRR 그리고 고객유치비용등을 같이 봐야 하겠지만 일단 첫달 이탈률이 매우 높아 만약 비즈니스에 문제가 좀 있다는 것을 알 수 있습니다.

코호트 분석에서 볼 수 있는 것들

리키버킷은 사용자 또는 고객이 일정 수가 지속적으로 이탈하는 상태를 말하는 신조어인데, 결국 신규 고객의 유입이 고객의 이탈을 따라잡지 못하거나 각종 리텐션 방법으로 빠져나가는 사용자를 방어하지 못하면 장기적으로 비즈니스를 안정화할 수 없거나 망하게 됩니다.

리키버킷은 물이 새는 양동이라는 뜻입니다

고객유실(고객 이탈)을 완벽하게 막을 수는 없겠지만 최대한 잘 방어하지 못하면 매출이 늘어나도 장기적인 수익률이 증가하지 않는다거나 마케팅 비용을 허비한다거나 하는 문제가 발생하는데 코호트 분석에는 이 부분을 중점적으로 밝히려고 하는 것입니다.  고객유실을 더 이상 줄이지 못한다고 판단되면 고객유치비용을 조절하거나 해야 합니다.
이외에도 코호트 분석을 하는 주된 이유는 고객의 반응은 서비스나 상품이나 서비스에 대해 라이프타임(수명)을 가지고 있는데, 어떤 비즈니스이던 고객의 비즈니스에 대한 라이프사이클을 길게 유지하고 이탈하지 못하도록 방어하는데 필요한 정보를 얻는데 있습니다.
그리고, 신규 고객을 유입시키는 것 보다는 기존 고객의 이탈방지를 하는 것이 비용소모가 더 적고 효율적인 것으로 알려져 있습니다.

고객 유지를 위해서는 현재의 비즈니스가 다음 4가지 중 어느 상황인지 판별을 해야합니다. (이외도 봐야 하는 것들이 상당히 많습니다만 마켓분석이 전문이 아니라서 저도 공부가 굉장히 필요할 것 같습니다)

  1. 매출이 새로운 인입 고객로부터만 발생한다. (제로섬에 가까운 망조)
  2. 매출이 한 사람당 한 번 만 이루어지고 더 이상 발생하지 않는다. (얼리 어댑터 문제로 빨리 망할 징조)
  3. 매출이 기존 고객으로부터만 발생한다. (더 이상 신규고객이 없어 서서히 망해가는 징조)
  4. 매출이 새 인입고객과 기존 고객으로부터 발생한다. (좋은 징조)

여기서 매출은 온라인 서비스라면 페이지뷰(page view)로 생각하면 됩니다. 게임이라면 처음 가입해서 하던 고객이 얼마만에 게임을 그만 두는지가 되겠습니다.
최근 IT기반 스타트업의 마케팅 분석에서 코호트 분석이 많이 쓰입니다. 비즈니스 형태가 코호트 분석을 하기에 잘 맞아 떨어져서 그런것도 같습니다.

위의 상황중 어느 상황에 해당하는지를 확인하기에 가장 좋은 것 중 하나가 코호트 분석이라고 알려져 있습니다.
최근 온라인 서비스들은 깔때기 분석(Funnel Analysis), 코호트 분석 (Cohort Analysis), 대조군 테스트 (A/B test, 버킷 테스트라고도 합니다)에 대해서 잘 알아야 한다고 말합니다.
이중에서 제가 생각할 때 가장 중요한 것은 버킷테스트(A/B test) 입니다. (이것은 예전 블로그에서도 설명한 적이 있습니다만)
기술적으로는 코호트 분석은 집단을 테스트나 비즈니스로의 진입 시작 시점으로 구분해서 통계지표를 나누어 확인하는 것으로 복잡한 알고리즘이 사용되는 것은 아닙니다.

물론 원천데이터의 형태에 따라 집계는 다소 컴퓨터 연산자원이 필요하거나 복잡할 수 있습니다.

구체적으로 예를 들어 설명하면 월별로 가입한 사람들을 따로 분류(segmentation)해서 월별 흐름에 따른 주요 지표의 추이를 보는 것입니다. 이렇게 나누는 것이 유용한 이유는 시대를 함께 겪은 그룹끼리는 사회적으로 공감대나 어떤 특성등을 가지게 되고 그것들이 고객행위의 라이프사이클에 각각 다르게 영향을 끼친하는 것입니다. 즉 월별로 진입한 사람들은 뭔가의 영향에 동질감을 가지게 되어 있어서 그게 뭔지 알아야 한다는 것입니다. 그리고 좀더 자세히 분석하기 위해서 데이터를 드릴다운(drill down)해서 특별히 더 세분화된 그룹을 본다거나 개별 고객을 확인해 본다거나 하는 것도 추가로 해 볼 수 있습니다.

 

Author: 떰학

2 thoughts on “코호트 분석 (Cohort Analysis)

    1. 저도 샘플을 보고 따라한 것인데 원천자료에서 그 부분 설명을 보지 못했습니다. 진입하자마자 빠져나간 사람이 2명이라고 생각됩니다.
      즉, 어떤 온라인 쇼핑몰에 신규 가입은 80명이 했는데 그달 서비스에서 구매는 78명만 한것으로 이해하고 있습니다.

답글 남기기