数据分析 36 计(11):如何用贝叶斯概率准确提供业务方营销转化率

Tian
Tian
Tian
33
文章
7
评论
2021年2月21日17:33:55
评论
591 1531字阅读5分6秒
摘要

通过贝叶斯方法计算概率能更好的得出准确描述业务状态的结果。

数据分析 36 计(11):如何用贝叶斯概率准确提供业务方营销转化率

1. 背景

seeder 是一家在加利福尼亚州销售电动踏板车的公司,他们正试图通过在德克萨斯州开拓新市场,seeder 的营销团队利用印刷媒体,并设计了一本小册子以吸引新客户,他们将小册子分发给 23 个人,最终完成 9 笔订单。
seeder 管理层想知道是,印刷媒体在推销新的电动滑板车方面有多好?如果公司继续制作大量小册子,能预计有多少的转化率 ?首先,一般的商业分析师会想到用频率学派中的频率代表概率的方法,转化率等于订单数除以分发的总数为 $\frac{9}{23}= 0.39 $ 。
但是这里的小样本不适用于上面的计算,通过贝叶斯方法计算概率能更好的得出准确描述业务状态的结果。

2. 使用贝叶斯概率来量化不确定性

为了能量化业务中转化率的不确定性,我们需要解决三件事:

数据

本案例中的数据将来自我们进行的初步研究。我们知道,在向这本小册子展示的 23 家德克萨斯人中,有 9 家被转化为客户。

生成模型
生成模型传递某些参数,例如转化率,以便该模型基于该参数模拟业务数据。例如,我们可以假设转化率为 40%,然后向随机选择的 50 个德克萨斯州人展示手册。根据我们假定的转化率,生成模型将估算出将要进行的 20 笔销售。现在基于假设的生成模型,已知业务数据,反向求解生成模型,以便得到转化率。为了实现这一点,我们需要先确定先验概率。
先验概率

先验是模型在看到任何数据之前所拥有的信息。用贝叶斯术语来说,先验是一种概率分布,用于表示模型中的不确定性。这里的先验概率分布为转化率的概率分布。这里无法得知转化率这一先验分布具体是哪一种分布(主观先验),可以采用无信息先验分布来进行计算。没有转化率的任何信息即为:将转化率取值范围上的均匀分布作为转化率的先验分布。通过使用 [0, 1] 的均匀概率分布,表示在看到任何数据之前,该分布假设 0 和 1 之间( 0% 到 100% )之间的任何转化率的概率都是相等的。

拟合模型

用先验分布为参数值模拟随机样本。在本例中,参数值是转化率。R 语言如下:
# number of samples to draw from the prior distribution
n_size <- 100000
# drawing sample from the prior distribution - which in our case is uniform distribution
prior_dist <- runif(n_size, 0, 1)
# peeking at the histogram to verify the random sample was generated correctly.
hist(prior_dist, main = "Histogram of Prior Distribution", xlab = "Prior on the Conversion Rate", ylab = "Frequency")

 

本文在微信公众号是付费文章,设置付费是为了提高一点点门槛,让知识的质量更好。这也是促使作者写出更优质文章的一种方式,希望您看完能有所收获,感谢支持!

手机端用户请使用微信扫一扫扫描以下二维码继续阅读

数据分析 36 计(11):如何用贝叶斯概率准确提供业务方营销转化率

weinxin
微信公众号
微信公众号搜索关注「DataGo 数据狗」 数据分析从 0 到 1 再到 2 。
Tian
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: