如何用熵权法计算权重?

如何用熵权法计算权重?,第1张

熵权法是一种客观赋权方法。十分复杂,计算步骤如下:

1、构建各年份各评价指标的判断矩阵。

2、将判断矩阵进行归一化处理, 得到归一化判断矩阵。

3、根据熵的定义,根据各年份评价指标,可以确定评价指标的熵。

4、定义熵权。定义了第n个指标的熵后,可得到第n个指标的熵权。

5、计算系统的权重值。

根据信息熵的定义,对于某项指标,可以用熵值来判断某个指标的离散程度,其信息熵值越小,指标的离散程度越大, 该指标对综合评价的影响(即权重)就越大,如果某项指标的值全部相等,则该指标在综合评价中不起作用。

因此,可利用信息熵这个工具,计算出各个指标的权重,为多指标综合评价提供依据。

注意事项:

系统由有序转变为无序被的过程是熵增,比如系的鞋带会开;家中铺的很整齐的床单睡过后会变乱。

“热力学第二定律”热量可以自发地从较热的物体传递到较冷的物体,但不可能自发地从较冷的物体传递到较热的物体。

比如一滴墨滴进清水,清水会变黑;一个热的物体和一个冷的物体放在一起,热的物体会变冷,冷的物体会变热.....物理系统总是会趋向平衡状态。

一个系统的温度是不均匀的,它慢慢趋向均匀;一个溶液的浓度是不均匀的,同样它会慢慢趋向均匀。

熵权法是一种常用的多指标决策方法,适用于栅格数据的熵权法计算可以按照以下步骤进行:

1. 对每个指标进行标准化处理,将所有指标的值都缩放到0-1之间。

2. 计算每个指标的信息熵,公式为:$E_i = -\sum_{j=1}^{n}p_{ij}\log_2p_{ij}$,其中 $p_{ij}$ 表示第 $i$ 个指标在第 $j$ 个像元上的占比, $n$ 表示样本总数。可以通过 ArcGIS、QGIS 等软件进行计算。

3. 计算每个指标的权重,公式为:$w_i = \frac{1-E_i}{k-\sum_{j=1}^{m}(1-E_j)}$,其中 $k$ 表示指标的数量,$m$ 是除去第 $i$ 个指标后剩余指标的数量。

4. 对每个像元的指标值进行加权求和,即:$S_j = \sum_{i=1}^{m}w_ix_{ij}$,其中 $x_{ij}$ 表示第 $j$ 像元上第 $i$ 个指标的值。

5. 对加权和进行分类,划分出若干等级,例如:极高、高、中、低、极低。

栅格数据的熵权法计算需要使用专业软件,如 ArcGIS 和 QGIS 等,具体 *** 作可以参考软件帮助文档或相关教程。

一、分析前准备

1.研究背景

TOPSIS法用于研究评价对象与‘理想解’的距离情况,结合‘理想解’(正理想解和负理想解),计算得到最终接近程度C值。熵权TOPSIS法核心在于TOPSIS,但在计算数据时,首先会利用熵值(熵权法)计算得到各评价指标的权重,并且将评价指标数据与权重相乘,得到新的数据,利用新数据进行TOPSIS法研究。

通俗地讲,熵权TOPSIS法是先使用熵权法得到新数据newdata(数据成熵权法计算得到的权重),然后利用新数据newdata进行TOPSIS法研究。

例如:当前有一个项目进行招标,共有4个承包商,分别是A,B,C,D厂。由于招标需要考虑多个因素,各个方案指标的优劣程度也并不统一。为了保证评价过程中的客观、公正性。因此,考虑通过熵权TOPSIS法,对各个方案进行综合评价,从而选出最优方案。

2.数据格式

熵权TOPSIS法用于研究指标与理想解的接近度情况。1个指标占用1列数据。1个研究对象为1行,但研究对象在分析时并不需要使用,SPSSAU默认会从上到下依次编号。

二、SPSSAU *** 作

(1)登录账号后进入SPSSAU页面,点击右上角“上传数据”,将处理好的数据进行“点击上传文件”上传即可。

(2)拖拽分析项

在“综合评价”模块中选择“熵权topsis”方法,将分析项拖拽到右侧分析框中,点击“开始分析”即可。

三、SPSSAU数据处理

1.数据正向化/逆向化处理

如果数据中有逆向指标(数字越大反而越不好的意思),此时需要使用‘SPSSAU数据处理->生成变量’的‘逆向化’功能处理。让数据变成正向指标(即数字越大越好的意思)。

‘逆向化’的数据计算公式为:(Max-X)/(Max-Min),明显可以看出,针对逆向指标进行‘逆向化’处理后,数据就会变成正向指标。

【SPSSAU】数据无量纲化处理 | 数据分析常见问题解答

2.数据标准化处理

针对数据进行标准化处理,目的在于解决量纲化问题。常见的标准化处理方法有:‘归一化’,‘区间化’,‘均值化’等。

(1)‘归一化’将所有数据压缩在0到1之间;

(2)‘区间化‘将所有数据压缩在自己设定的区间;

(3)‘均值化’= 当前值 / 平均值。

补充说明:

一般而言,如果数据全部都大于0,建议使用‘均值化’;如果数据中有负数或者0,建议做‘区间化’让数据限定在一个区间(SPSSAU默认1~2之间);当然也可以考虑‘归一化’,让数据全部介于0~1之间。

具体标准化的处理方式有很多种,具体结合文献和自身数据选择使用即可。不同的处理方式肯定会带来不同的结果,但结论一般不会有太大的偏倚。

(如果数据进行了正/逆向化处理就不需要再进行标准化处理。)

四、SPSSAU分析

背景:当前有6个国家经济技术开发区,分别在政务系统的4个指标上的评分值。数字越大表示指标越优。当前希望利用熵权TOPSIS法评价出6个开发区的政务系统排名情况。原始数据如下:

本案例数据中包括4个政务系统的评价指标,而且全部都是正向指标,因此不需要进行正向化或者逆向化处理。以及接着数据标准化解决量纲问题上,本例子使用‘均值化’处理方法。 *** 作为SPSSAU数据处理->生成变量:

完成数据‘均值化’处理后,直接开始进行‘熵值TOPSIS法’分析, *** 作如下图:

1.熵值法计算权重结果汇总

上表格展示出4个政务系统指标的权重值,明显可以看出指标3的权重更大。但权重大小仅仅是过程值,熵值TOPSIS分析重心在于TOPSIS法计算出相对接近度。权重值与数据相乘,得到新数据newdata,这一过程是SPSSAU自动完成,利用newdata进行TOPSIS法计算。

2.TOPSIS评价计算结果

从上表可知,利用熵权法后加权生成的数据(算法自动完成)进行TOPSIS分析,针对4个指标(MC_政务系统指标1, MC_政务系统指标2, MC_政务系统指标3, MC_政务系统指标4),进行TOPSIS评价,同时评价对象为6个(样本量数量即为评价对象数量);

TOPSIS法首先找出评价指标的正负理想解值(A+和A-),接着计算出各评价对象分别与正负理想解的距离值D+和D-。根据D+和D-值,最终计算得出各评价对象与最优方案的接近程度(C值),并可针对C值进行排序。

最终从上表可知:评价对象4,即开发区4,它的相对接近度C值最高为0.9995,因而说明开发区4在政务系统上的表现最优;其次是开发区3,相对接近度C起来0.8141。开发区1的政务系统表现最差。

3.正负理想解

4.描述统计

分析数据完整并无缺失等,可通过上表格查看各分析项的平均值或标准差值等。从上表格可以看出四个分析项的样本量均为6,平均值均为1。

五、其他说明

1.如果分析数据中有负数或者0值如何办?

如果分析数据有负数或者0,这会导致无法进行熵值法计算,SPSSAU算法默认会进行‘非负平移’处理。SPSSAU非负平移功能是指,如果某列(某指标)数据出现小于等于0,则让该列数据同时加上一个‘平移值’(该值为某列数据最小值的绝对值+0.01),以便让数据全部都大于0,因而满足算法要求。

2. 面板数据如何进行熵值TOPSIS法?

熵值TOPSIS法的原理是先进行熵值法,然后再进行TOPSIS法。无论是面板或者非面板数据,均可正常进行熵值TOPSIS法研究,并不需要特别处理。(当然面板数据进行分析时,也可以先筛选出不同的年份,重复进行多次均可)。

六、总结

熵权TOPSIS法分别涉及熵权法和TOPSIS法;熵权法计算各评价指标的权重值,然后利用权重值乘原始数据,得到newdata。系统利用newdata进行TOPSIS法进行计算,最终得到各评价对象的接近程序C值,用于判断和衡量评价对象的优劣排序等。

今天的分享就到这里啦,更多干货请前往 SPSSAU 官网查看。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/12036527.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-20
下一篇 2023-05-20

发表评论

登录后才能评论

评论列表(0条)

保存