1. 断点回归
断点回归设计可以控制观察到的混杂因素,也可以控制未观察到的混杂因素的影响,即可以防止遗漏变量带来的问题,除了工具变量和随机分组外,它应该是唯一的一个可以控制未观察到混杂因素的研究方法。它好在能做到局部随机 ( Sharp RD 的话)。举个例子:
假定今年有一种录取考试,分数公布之后,暨大决定只录取 2200 分以上的考生,2200 分以下的决不录取。那么当你的分数大于 2200 分时,你进入暨大的概率就为 1 ,否则为 0 。Score = 2200 处形成一个跳跃点 cut-off point(如图所示),Score 被叫做 running variable,forcing variable。
断点回归设计的原理就是,在个体(考生)不能完全操控且不能预知暨大录取分数线的时候,暨大随机决定一个分数的情况下,我们可以把接近2200分(断点)附近的考生看成是几乎一样的个体,因为考2199分的同学和考2201分的同学基本上是没有差别的(随机),表现在: background characteristics should be similar near 2200 and the other variables cannot have a threshold in 2200。那么暨大决定的2200分数线就是一个外生的试验控制。相当于把2200分附近的同学随机的分配到:{读暨大,不读暨大}。
断点回归设计的最大缺点在于:外部有效性很弱。在实证分析的因果推论中,有外部有效性(external validity)和内部有效性(internal validity)两个概念。具有内部有效性是指:在你解释或研究的样本内部,很好的解决了内生性问题,得到了样本内的准确估计。外部有效性就是把估计的这个结果往外推广是遇到的问题。比如:政府实行最低工资标准制度,在样本中,估计出来了 A 县因为提高最低工资标准 100 块钱而使得失业率上升了 0.1%。外部有效性就是,把 treatment effect "0.1%" 推广到全国是不是结果依然稳健适用,推广到全世界呢?因为断点回归只能做到局部(断点附近)随机,它能准确推断出来的也就是这断点附近人群的政策效果。要把局部政策效果外推,将非常困难。
2. 产品设计效果评估
假定 2013 一整年中获得赞数超过 5000 的用户有资格获得徽章。那么断点回归的关注点是那些刚刚好获得徽章(即有 5000 个赞)和那些差一点够资格(获得 4999 个赞)的用户,他们之间的差异或多或少是随机的。我们可以用这个阈值来估计因果效应。比如说,在下面这个虚构的图表中,在 5000 赞这个界限处的不连续性表明,获得勋章的作者平均会多大约 100 多个粉丝。说明在 5000 赞后给予徽章的产品设计给创作用户带来了更多的粉丝数量。
3. 学习资料

评论