数据分析 36 计(4):互联网广告渠道归因分析之 Shapley Value

Tian
Tian
Tian
33
文章
7
评论
2021年2月14日21:55:38
评论
1,161 2044字阅读6分48秒
摘要

Shapley Value 的原理是基于联合博弈论 (Coalitional Game Theory) 的理论,可以通过该原理计算出每个渠道及组合的投放效果。

数据分析 36 计(4):互联网广告渠道归因分析之 Shapley Value

1. Shapley Value

Shapley Value 的原理是基于联合博弈论 (Coalitional Game Theory) 的理论。Shapley Value 的计算公式表达式如下所示:

$$\varphi_i(\nu)=\sum_{S \subseteq N \setminus \{i\} } \frac{|S|!(|N|-|S|-1)!}{N!} (\nu(S \cup \{i\})-\nu(S)) $$

这里最终计算的值是特征 $i$ 的重要程度。前面一部分分式表示的是权重, 后面一部分括号内表示的是新增特征 $i$ 前后的变化值。

2. 互联网广告渠道归因分析

这里直接上例子来解释上面的公式,比如假设有 3 个渠道:信息流 (A),开屏 (B),视频 (C)。他们的独自投放、两两投放和三个一起投放的效果如下图所标识。现在要求得到每个渠道的贡献比例。

数据分析 36 计(4):互联网广告渠道归因分析之 Shapley Value

图1 各渠道组合的投放效果

 

下面,我们来计算,每一个渠道的夏普里值,夏普里值的定义:是在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。三个渠道一共有 $3!$,即 6 种可能联盟次序:

  • A 投放后接着投放 B 形成方案 S,B 投放后接着投放 C 形成方案 S,即 A→B→C
  • A 投放后接着投放 C 形成方案 S,C 投放后接着投放 B 形成方案 S,即 A→C→B
  • B 投放后接着投放 A 形成方案 S,A 投放后接着投放 C 形成方案 S,即 B→A→C
  • B 投放后接着投放 C 形成方案 S,C 投放后接着投放 A 形成方案 S,即 B→C→A
  • C 投放后接着投放 A 形成方案 S,A 投放后接着投放 B 形成方案 S,即 C→A→B
  • C 投放后接着投放 B 形成方案 S,B 投放后接着投放 A 形成方案 S,即 C→B→A

对于每一种合作的方式, 我们考虑他们的边际收益, 即某个渠道加入方案执行前后的收益变化。对于每个渠道的贡献度的计算过程如下所示, 我们只是改变了加入的顺序而已。

数据分析 36 计(4):互联网广告渠道归因分析之 Shapley Value

图2 每个渠道的贡献度的计算过程

 

因此,信息流 A 的 Shapley value 为 34.17,开屏 B 的 Shapley value 为 41.67,视频前贴 C 的 Shapley value 为 24.17。

上面是直接用 Shapley value 的原理来进行计算,下面我们直接的式子来计算某渠道 $i$ 加入方案集合 S 后的边际贡献, 我们需要罗列出 S 所有的可能性。

$$\varphi_i(\nu)=\sum_{S \subseteq N \setminus \{i\} } \frac{|S|!(|N|-|S|-1)!}{N!} (\nu(S \cup \{i\})-\nu(S)) $$

我们说一下具体的例子, 比如说我们要计算渠道 A 的贡献值, 那么所有 S 可能的集合有:

  • S 为空集,即最先投放渠道 A
  • S 中只有一个元素, 可以是 B, 或是 C,即第二投放渠道 A
  • S 中有两个元素, 可以是 B+C,即第三投放渠道 A

计算 A 的贡献度时,S 集合共有 5 种可能性。我们要分别计算着 5 种情况下的边际收益(我们需要注意到的是, 这 5 种情况不是等可能出现的)。$|S|!$ 为投放在 A 前面的渠道顺序的排列组合,$(|F|-|S|-1)!$ 为投放在 A 后面的渠道顺序排列组合。$|F|!$ 为所有投放顺序的排列组合,即 $|F|!=3!=6$。

那么,当 S 为空集时,即最先投放 A,有:

$$\varphi_{A1}=\frac{0!(3-0-1)!}{3!}[\nu(A)]=3.33$$

S 中只有一个元素, 可以是 B , 或是 C,即第二投放渠道 A,有:

$$\varphi_{A2}=\frac{1!(3-1-1)!}{3!}[\nu(A,B)-\nu(B)+\nu(A,C)-\nu(C)]=9.17$$

S 中有两个元素, 可以是 B+C,即第三投放渠道 A,有:

$$\varphi_{A3}=\frac{2!(3-2-1)!}{3!}[\nu(A,B,C)-\nu(B,C)]=21.67$$

那么 A 的贡献度为 34.17,和上面结论一致。

$$\varphi_{A}=\varphi_{A1}+\varphi_{A2}+\varphi_{A3}=34.17$$

通过上面的例子,公式现在就很好解释了,首先是最先投放 A,那么 A 的贡献度肯定等于单独投放 A 的效果,再计算最先投放 A 的概率,即 1/3(因为 Shapley Value 假设的是随机投放每个渠道的概率相等,所以可以使用排列组合计算概率。);然后是第二顺序投放 A,那么第一顺序投放 B 的概率为 1/6,那么 A 的贡献度肯定等于同时投放 AB 的效果减去单独投放 B 的效果,即 A 的贡献度为投放 AB 时在 B 基础上的增量( C 同理);最后第三顺序投放 A,那么前面有 BC 和 CB 两种,那么这种情况出现的概率为 1/3,那么 A 的贡献度肯定等于同时投放 ABC 的效果减去同时投放 BC 的效果。最后将三种情况合计起来即可得到 A 的贡献度。

weinxin
微信公众号
微信公众号搜索关注「DataGo 数据狗」 数据分析从 0 到 1 再到 2 。
Tian
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: