1. 背景
2. 使用贝叶斯概率来量化不确定性
- 数据
- 生成模型
- 先验概率
数据
本案例中的数据将来自我们进行的初步研究。我们知道,在向这本小册子展示的 23 家德克萨斯人中,有 9 家被转化为客户。
生成模型传递某些参数,例如转化率,以便该模型基于该参数模拟业务数据。例如,我们可以假设转化率为 40%,然后向随机选择的 50 个德克萨斯州人展示手册。根据我们假定的转化率,生成模型将估算出将要进行的 20 笔销售。现在基于假设的生成模型,已知业务数据,反向求解生成模型,以便得到转化率。为了实现这一点,我们需要先确定先验概率。
先验是模型在看到任何数据之前所拥有的信息。用贝叶斯术语来说,先验是一种概率分布,用于表示模型中的不确定性。这里的先验概率分布为转化率的概率分布。这里无法得知转化率这一先验分布具体是哪一种分布(主观先验),可以采用无信息先验分布来进行计算。没有转化率的任何信息即为:将转化率取值范围上的均匀分布作为转化率的先验分布。通过使用 [0, 1] 的均匀概率分布,表示在看到任何数据之前,该分布假设 0 和 1 之间( 0% 到 100% )之间的任何转化率的概率都是相等的。
拟合模型
# number of samples to draw from the prior distribution n_size <- 100000 # drawing sample from the prior distribution - which in our case is uniform distribution prior_dist <- runif(n_size, 0, 1) # peeking at the histogram to verify the random sample was generated correctly. hist(prior_dist, main = "Histogram of Prior Distribution", xlab = "Prior on the Conversion Rate", ylab = "Frequency")
本文在微信公众号是付费文章,设置付费是为了提高一点点门槛,让知识的质量更好。这也是促使作者写出更优质文章的一种方式,希望您看完能有所收获,感谢支持!
手机端用户请使用微信扫一扫扫描以下二维码继续阅读

微信公众号
微信公众号搜索关注「DataGo 数据狗」 数据分析从 0 到 1 再到 2 。
评论