애드테크 | 토탈 데이터 사이언스

Last Touch Attribution은 광고 마케팅에서 사용하는 용어입니다.

데이터 기술로는 애드테크(Ad tech), 마테크(MarTech)에서 볼 수 있는 용어입니다.

번역할 수 있는 적당한 한국말이 아직 없어 그냥 “라스트 터치 애트리뷰션”이라고 부릅니다.

Last Touch Attribution이란?

간단하게 설명하면

광고주가 여러 광고매체에 광고를 했는데 고객이 전환을 만들었을 때 한 고객이 여러 매체를 통해 들어왔더라고 전환이 발생하기 직전인 가장 마지막에 고객이 접촉한 매체(광고수단)에만 그 기여를 인정하겠다는 것을 말합니다.

자세히 설명하면

짧고 작게 볼 때 광고의 목적은 전환을 발생시키는데 있습니다. 크게 보면 회사의 매출을 올리는데 있고 비즈니스를 성장시키는데 있습니다만.

전환은 구매, 회원가입, 상담신청하기, 앱 설치하기, 사전구매 신청하기 , 구독하기 등과 같은 광고주의 비즈니스에서 매출과 직접 관련이 있거나 광고주가 광고를 통해서 고객으로부터 얻고 싶은 최종 액션을 말합니다.

전환을 발생하기 위해서 어떤 매체가 파급력이 좋을 지, 효율이 좋을지 모르고 또 잠재 고객이 어느 특정 매체에 몰려 있거나 하지 않기 때문에 여러 매체를 통해 광고를 진행합니다.

매체는 구글키워드광고, 구글디스플레이광고, 페이스북광고, 인스타그램광고, 유튜브광고, 이메일, 카카오복 광고 같은 것들을 말합니다.

여러 매체를 통해 여러 캠페인을 진행하면 동일한 제품 또는 제품 카테고리에 대해서 동일한 사람이 여러 매체에서 광고를 보고 각각 클릭을 해서 제품을 살펴보고 구매의사가 있다면 구매를 하게됩니다.

이때 1명의 고객이 여러 매체에서 광고를 모두 보고 클릭을 했지만 구매 직전에 마지막에 클릭한 매체의 기여만 인정하고 나머지는 무시하는 것이 Last Touch Attribution입니다.

이것은 마지막에 클릭한 매체에서 보여졌던 광고가 전환에 가장 큰 영향을 줬다고 그 영향이 결정적이었다고 간주하는 것입니다.

Last Touch Attribution 모델의 문제점

상식적으로 볼 때 이 것은 매체들에게는 매우 불리합니다. 고객이 어느 시점에 물건을 살지를 알아서 그 직전에 광고를 보여주고 클릭하도록 만들어야 하는데 쉬운 것이 아닙니다. 그리고 앞서 발생햏던 모든 클력을 무효로하고 마지막 클릭만 전환에 기여했다는 것은 상식적으로도 말이 되지 않습니다.

Last Touch Attribution 모델을 쓰는 이유

광고생태계에서는 대부분의 MMP(Mobile Measurement Partner, 모바일 앱에서 광고 성과를 추적해주는 서비스)나 GA등은 이 모델은 기본으로 기여도를 산출하고 있고 광고주들도 이 모델은 기본으로 하고 있습니다. 물론 다른 기여도 모델도 지원하긴 하지만 기본으로 지원하는 것을 그냥 대부분 쓰기 때문에 다른 모델을 쓰는 경우는 많지 않습니다.

또 다른 이유는 이게 계산하기 편하고 쉽기 때문입니다.

즉 다른 기여도 모델에 비해서 데이터프로세싱에 드는 리소스가 적고 덜 복잡하기 때문입니다. 보통 마케팅을 집행하는 마케팅부서는 IT부서가 아니고 IT지원을 받지 못하거나 받지 않으려고 하는 경향이 강해서 데이터프로세싱을 잘 하지 못합니다. 그래서 비교적 데이터프로세싱이 편한 방법을 쓰거나 기본으로 프로세싱까지 해서 수치를 산출해 주는 Last Touch Attribution을 쓰게 됩니다.

광고주 입장에서는 속 편한 것입니다. 광고주는 갑이고 매체들은 을이기 때문에 광고주가 마지마 터치만 인정하겠다고 선언하면 그뿐입니다. 기여도를 올리고 싶다면 전환직전의 마지막 클릭을 만들면 된다고 말하고 그렇게 하라고 하면 됩니다.

기여도가 낮은 매체는 어떻게 되는가?

기여도가 낮은 매체는 광고 효율이 좋지 않기 때문에 광고주가 광고비를 줄일 때 가장 먼저 광고를 진행하지 않고 빼버리는 대상이 됩니다. 특정 매체의 경우 First Touch가 아주 높다면 그런 매체는 이 모델로 판정하게 되면 기여도가 매우 낮기 때문에 빠지게 됩니다.

그래서 Last Touch를 많이 만들지는 못했지만 First Touch나 Middel touch가 많은 매체는 이 모델이 불공평하다고 주장하고 Last Touch가 좋은 매체는 Last Touch가 가장 좋다고 주장합니다.

업종과 물건에 따라 다른 Last Touch

Last Touch는 업종, 물건의 종류, 물건의 가격대, 구입하는 고객의 구성에 따라 다릅니다. 그렇기 때문에 광고주의 입장에서는 자신들이 판매하는 물건 또는 비즈니스의 특성과 고객군에 대해 제대로 이해하고 있어야 하고 그에 따라 어떤 Touch Model을 쓸지와 어던 매체가 좋은지도 판단해야 합니다.

단순하게 어떤 것이 가장 좋으니 그것만 쓰면 된다고 말할 수눈 없습니다.

필요한 데이터 기술

앞서 말했듯이 last touch attribution은 아주 쉽습니다. 전환 이 전에 가장 마지막에 고객이 타고 들어온 광고매체가 어딘가를 찾아내서 카운트해주면 됩니다.

RDB, 빅데이터플랫폼, 실시간 데이터처리 플랫폼으로도 매우 쉽습니다. 그 외에 통계 기술, 기계학습, AI는 전혀 필요하지 않습니다.

간단하다고는 말하지만 엑셀로 하려면 매우 복잡합니다. 그래서 데이터프로세싱 기술이 전혀 필요 없다고는 할 수 없습니다. 물론 데이터가 아주 많지 않다면 엑셀로 할 수는 있습니다.

Multi Touch Attribution 모델

하지만 최근에는 이 모델이 정말 효율좋은 광고 매체를 골라내지 못한다는 당연한 문제점 때문에 Multi Touch Attribution Model을 사용하는 경우가 늘고 있습니다.

MAB는 기계학습 강화학습의 일종입니다. 완전한 강화학습은 아니지만 포함해서 취급합니다.

MAB는 “엠에이비”, “멀리암드밴딧”이라고 발음합니다.

“팔 여러 개 달린 산적” “Multi Armed Bandit”은 슬롯머신의 별명인데 이 알고리즘은 이름처럼 “어떤 슬롯 머신의 팔을 당겨야 돈을 딸 수 있는가?” 와 같은 문제를 풀기위한 방법입니다.

엄밀한 의미의 강화학습에 포함되지 않지만 상당히 간단하고 쓸만하고 강화학습의 개념을 익히기 좋기 때문에 강화학습을 설명할 때 가장 먼저 설명하는 것이기도 합니다.

여러 대의 슬롯 머신이 있고 이 슬롯 머신 중 어떤 것의 레버를 당겨야 돈을 딸 수 있는가를 푸는 문제입니다. 한 번에 1대의 슬롯머신의 레버를 당기고 계속해서 반복합니다.

이 문제의 전제 조건이 있는데 한 번에 하나의 슬롯머신의 팔을 당길 수 있다는 것입니다.

그래서 동시에 모든 슬롯머신의 팔을 당겨서 그리고 여러번 당겨서 어떤 슬롯머신이 돈을 딸 학률이 높은지 알아낼 수 없습니다.

그래서 한 번에 하나씩만 선택해서 돈을 최대한 많이 따는 것이 이 문제의 푸는 목적입니다.

복잡한 공식은 여기에 안 적겠습니다. 구글에서 찾아보시면 수식과 코드가 다 있습니다.

첫번째 방법. Greedy 욕심쟁이

모든 슬롯머신에 순차적으로 한 번씩 팔을 내려봅니다. 그래서 돈을 못땄다면 다시 한 번씩 다 팔을 내려봅니다.

몇번을 수행한 후에 딴 돈이 가장 많은 슬롯머신에게 계속해서 몰빵합니다.

이게 그리디(Greedy, 탐욕스러운) 방식입니다. 단순하면서도 조금 무식한 방법입니다.

두번째 방법. epsilon

Greedy 방법을 사용하되 무작정 사용하지 않고 랜덤으로 팔을 당길 확률을 정해놓습니다.

만약 50%의 확률로 랜덤을 고르겠다고 하면 한 번은 지금까지 가장 돈을 많이 딴 슬롯머신을 당기고 한 번은 랜덤으로 아무것이나 고르는 방법입니다.

그나마 다른 것들에게 기회를 준다는 것 때문에 낫습니다.

epsilon이라는 이름은 랜덤으로 고를 확률값을 epsilon이라고 이름을 붙여서 부르기 때문입니다.

세번째 방법. UCB(Upper-Confidence-Bound)

위의 epsilon에서 약간의 공식을 주어서 랜덤 찬스가 왔을 때 무조건 랜덤으로 어떤 슬롯머신을 팔을 다기지 않고 덜 뽑혔던 슬롯머신에 가중치를 두어서 더 뽑아서 팔을 내려줍니다.

네번째 방법. Tompson sampling

톰슨 샘플링은 설명을 하면 조금 복잡해지는데 확률 분포 중 하나인 베타분포를 이용해서 확률이 가장 높은 것을 선택하는 것입니다.

베타분포 함수에 선택된 횟수와 돈을 딴 횟수를 입력하면 베타분포를 각각 구할 수 있고 그 베타분포를 확률 분포로 이용해서 값을 구하면 선택할 것을 찾을 수 있습니다.

저장된 데이터를 이용할 수 있는 장점이 있고 UCB 보다 성능이 조금 더 좋아서 온라인 추천 시스템에서 많이 이용되고 있습니다.

A/B 테스트와 MAB의 관계

A/B 테스트는 통계학의 실험계획법 중 하나 인데 2개 또는 2개 이상의 그룹을 동일한 수(최대한 비슷한 수) 만큼 각각 분할해서 한쪽에만 다른 처리를 해서 두 그룹의 차이를 보는 방법입니다

온라인에서는 흔히 버킷테스트라고 하는 방법입니다.

예를 들어 광고배너가 있는데 원래 배너는 테두리가 하얀색인데 테두리를 빨간색으로 바꿨을 때 사람들이 어떤 것을 클릭을 더 많이 하는지 알아 보고 싶을 때 같은 경우에 합니다.

A/B 테스트가 오랫동안 사용한 방법이기 때문에 잘 알려져 있지만 문제는 두 그룹을 방해받지 않게 불한하는 방법이 상당히 어렵고 두 그룹의 차이를 알아보는 방법이 데이터의 양상과 원래 데이터의 특성에 따라 여러가지 통계적인 방법을 써야하는 데 실수로 잘못된 방법으로 확인을 했다고 하더라도 그 실수를 알아내기 어렵다는 문제가 있습니다.

A/B 테스트를 하는 것은 많이 어렵지 않지만 A/B테스트의 결과를 해석하는 것은 매우 숙련된 통계학자가 필요하고 시간도 많이 걸립니다.

그래서 A/B 테스트를 하지 않고 각각 반응을 그대로 볼 수 있는 어떤 환경이 있다면 그 환경에서는 각각 매번의 결과에 따라서 결과가 좋은 것에 점수를 더 줘서 그것을 선택하게 만드는 방법을 쓰자는 것입니다.

그래서 MAB는 온라인 시스템의 추천시스템이나 평가에 굉장히 적합합니다.

광고시스템과 MAB

한 번에 5개의 제품을 동시에 보여지는 광고 이미지가 있다고 가정합니다.

사용자 별, 또는 사용자 그룹별로 어떤 제품에 더 관심을 가지는 지를 보고 클릭을 많이 하는 제품을 MAB에 의해서 더 많이 노출한다고 하겠습니다.

흔히 쓰는 방법이지만 이게 문제가 좀 있습니다.

선택할 제품이 매우 많은 경우에는 못합니다. 아마도 제품의 카테고리가 있고 그것들 중에 가장 잘 팔리는가 하는 전략을 취할 수 있지만 상식적으로 좋은 방법은 아닐 것입니다.
선호도는 계절성 효과, 요일 효과, 캠페인에 피로도에 따라 달라집니다. 슬롯머신 처럼 확률이 안변한다는 가정을 두기가 좀 어렵습니다. 변동이 너무 많습니다.
또 가중치를 변경하는 것 때문에 생기는 문제가 파생적으로 생기는데
- 쿠키로 인해 신규 및 재이용자의 분포에 영향을 미칩니다.
- 변화에 대한 적응이 느리기 때문에 인해 관성때문에 결과가 왜곡될 수 있습니다.

아주 단순한 경우에만 사용이 가능하며 복잡한 시스템으은 오히려 결과를 왜곡할 수 있습니다.

저렇게 선택한 것이 여전히 가장 좋은 방법 또는 그리 좋은 선택이 아닐 수도 있겠지만 그 자체를 확실하게 확인 못합니다. 이건 다른 알고리즘도 동일한 문제이긴 합니다만.

토탈 데이터 사이언스 – Total Data Science

카테고리 보관물: 애드테크

Last Touch Attribution, LTA 모델