之前介绍的层次分析法(AHP)和综合评价法(TOPSIS)都有依赖于一些主观的因素(比如层次分析法需要查找到两两指标之间的重要程度来构造判断矩阵,综合分析法需查找文献来给每个指标直接加上权重),它们都不能做到完全依赖数据本身,那么在无法从文献或者其它地方找到依据的情况下我们如何给出评价指标呢,这就用到我们今天所讲的熵权法。

建模步骤

数据标准化

由于数据指标类型不同,所以数据的数量级可能不同,数据指标可能存在负值而且可能同时存在正向指标(越大越好)和负向指标(越小越好),这就要求先将数据标准化。数据标准化要用不同的公式将正向指标和负向指标分开进行。

正向指标标准化

标准化后数据 =(原数据 — 原数据中最小值)/(原数据最大值)— 原数据最小值)

负向指标标准化

标准化后数据 =(原数据中最大值 — 原数据)/   (原数据最大值 — 原数据最小值)

很显然,标准化之后,所有的数据都落在0到1之间,而且负向指标的越小越好也转化为了和正向指标一样的越大越好。

注:之所以要先进行标准化,是因为可能出现我们上面所说的数据量级不同、数据存在负值、存在负向指标这三个情况之一或者更多,如果这三种情况都没有,那么可以不进行标准化。

求指标的熵权值和变异系数


huber标准差权重 标准差系数权重法_算法

表示标准化后的指标,i 表示第 i 种方案或者第 i 个人,j 表示第 j 个指标,那么某个指标数据出现的概率为,

huber标准差权重 标准差系数权重法_权重_02

,

 注意:分母为第 i 种方案或第 i 种指标的所有数据求和。

求熵值的公式为

第 j 个指标的熵公式为

huber标准差权重 标准差系数权重法_数据_03

,

变异系数为 

huber标准差权重 标准差系数权重法_最小值_04

.

显然,熵值越大,变异系数越小,那么该指标就越有序,该指标的信息量就越小。熵值越小,变异系数越大,那么该指标就越无序,该指标的信息量就越大。

根据变异系数求权重

计算第 j 个指标的权重

huber标准差权重 标准差系数权重法_数据_05

 ,

注意:这里分母是指标的变异系数之和。

显然指标的变异系数越大,指标权重越大

根据权重求综合评分

第 i 个对象的综合评价值为

huber标准差权重 标准差系数权重法_最小值_06

,

评价值越大越好,熵权法求得的评价值完全来自原始数据,没有拥戴任何其他主观因素。