数据分析 36 计(3):熵权法如何确定指标权重构建评价体系

Tian
Tian
Tian
33
文章
7
评论
2021年2月13日21:48:15
评论
786 1091字阅读3分38秒
摘要

信息论基本原理解释信息是系统有序性的度量单位,而熵可以度量系统的无序程度;如果某个指标的信息熵越小,该指标提供的信息量越大,指标变异程度(方差)高,因此在综合评价中所起作用理当越大,权重就应该越高。熵权法的基本原理就是根据指标变异性的大小来确定客观权重。

数据分析 36 计(3):熵权法如何确定指标权重构建评价体系

1. 熵权法

信息论基本原理解释信息是系统有序性的度量单位,而熵可以度量系统的无序程度;如果某个指标的信息熵越小,该指标提供的信息量越大,指标变异程度(方差)高,因此在综合评价中所起作用理当越大,权重就应该越高。熵权法的基本原理就是根据指标变异性的大小来确定客观权重。一般来说,这个方法相比于AHP专家打分更客观。熵权法确定指标权重的推导过程如下:

第一步:数据标准化

将各个指标的数据进行标准化处理。假设给定了 $k$ 个指标 ${X_1,X_2,...,X_k}$,其中第 $i$ 个指标上有 $n$ 个个体,指标数据为 $X_i={x_{1},x_{2},...,x_{n}}$。假设对各指标数据标准化后的值为 $Y_i={y_{1},y_{2},...,y_{n}}$ ,那么第 $i$ 个指标上的第 $j$ 个标准化后的值为

$$Y_{ij}=\frac{X_{ij}-min X_{i}}{max X_{i}- min X_{i}} $$

第二步:求各指标的信息熵

根据信息论中信息熵的定义,一组数据的信息熵计算为:

$$E_i=-lnn^{-1}\sum_{j=1}^n{p_{ij}lnp_{ij}}$$

,其中 $p_{ij}=\frac{Y_{ij}} {\sum_{j=1}^n{Y_{ij}}}$

第三步:确定各指标权重

根据信息熵的计算公式,计算出各个指标的信息熵为 ${E_1,E_2,...,E_k}$。通过信息熵计算各指标的权重:

$$W_i=\frac{1-E_i}{k-\sum_{i=1}^k{E_i}}$$

2. 评价体系之确定指标权重并计算样本得分

比如最近某快递公司在多地设置了快递点,但是快递点运营状态如何从数据上来获知,有哪些快递点需要取消,哪些快递点需要扩大经营?如何为给出每个快递点的具体得分,从而设置奖惩制度。这里建立一个评价体系,评价体系中包括能很好衡量快递点经营效果的指标,每个快递点都有这些指标的数据,因为熵权法可以自己计算出各个指标的权重,那么避免了专家打分法等主观权重带来的偏见,因此从该数据基础上即可获得各个快递点的得分。
熵权法计算过程:
求解过程放在了 Excel,公众号后台回复“熵权法”即可获取。
第一步:数据标准化。假设有 11 个快递点参与评价,评价体系中包括以下 7 个子指标,以下指标数据通过归一化公式已实现数据标准化。

表 1 数据标准化

数据分析 36 计(3):熵权法如何确定指标权重构建评价体系

第二步:求各指标的信息熵

表 2 求解各数据的 $p_{ij}$

数据分析 36 计(3):熵权法如何确定指标权重构建评价体系

表 3 求解信息熵 $E_i$

数据分析 36 计(3):熵权法如何确定指标权重构建评价体系

第三步:求各指标权重,见表 3 倒数第一行。

第四步:各快递点得分,见表 3 最后一列。可以看到快递点 S6 得分最高。

附:

求解过程放在了 Excel ,公众号后台回复“熵权法”即可获取。

weinxin
微信公众号
微信公众号搜索关注「DataGo 数据狗」 数据分析从 0 到 1 再到 2 。
Tian
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: