主成分分析与熵值法综合评价云南省乡村振兴发展水平

known 发布于 2025-07-23 阅读(318)

陈黎 陈平星

(云南大学滇池学院 云南昆明 653000)

2023年初,指导“三农”工作的中央一号文件正式发布,文件要求扎实推进乡村振兴建设,持续撬动金融和社会资本按市场化原则更多投向农业农村。乡村振兴工程是持久而全面的建设工程,包含着丰富的内涵和外延,构建合理且完善的评价体系是检验国家和各个地区乡村振兴完成程度的重要基础。关于乡村振兴指标体系构建的相关研究,张挺等(2018)通过理论分析及德尔菲专家打分法构造出基于全国层面的乡村振兴三层指标及其对应的若干目标值[1];刘瑾等(2021)通过对四川省部分州市的乡村振兴发展情况进行研究,构建了一套乡村振兴指标体系,并创新性地使用四川省乡村振兴监测数据进行实证分析[2]。此外,少量文献以全国省级面板数据为基础,构建我国乡村振兴综合评价指标体系并以此作为被解释变量,研究其他因素对乡村振兴发展水平的影响[3-5]。

云南省位于我国西部边陲,经济发展相对落后,乡村振兴担子重责任大,但同时云南乡村又有着广阔的地域范围、重要的地域经济社会单元功能以及独特的地域民族文化魅力。实施乡村振兴战略,对云南具有重大现实意义和深远历史意义。现有研究多以定性分析为主,定量文献少,郭豪杰等(2019)结合德尔菲法制定了一套云南省乡村振兴评价指标体系,利用AHP法进行指标测度[6],但AHP法属于主观赋权,人为评分可能会对乡村振兴发展水平的测算带来干扰。因此,本文立足云南省,以“产业振兴”等五大核心要求为一级指标,以“粮食总产量”等二十项具体内容为二级指标,构建云南省乡村振兴综合评价体系。为提高评价结果的准确性,本文分别采用主成分分析和熵值法测算云南省乡村振兴发展水平,并利用秩和比法进行归档,以此研判乡村振兴战略的提出是否真实有效地促进了云南省的乡村繁荣。

1 构建指标体系及资料来源

本文以国家乡村振兴战略五大要求为一级指标,结合《云南省乡村振兴战略规划(2018—2022年)》,充分考虑数据的可获得性、全面性、连贯性,共计选取了20个二级指标,以综合评价云南省乡村振兴发展水平,具体见表1。

表1 云南省乡村振兴综合评价体系

此外,数据选取时间为2009—2021年,在此期间我国先后提出了脱贫攻坚和乡村振兴战略,以用于考察云南省乡村发展建设随国家政策的变动情况。数据来源于《中国统计年鉴》《中国城乡建设统计年鉴》《中国农村统计年鉴》《中国人口与就业统计年鉴》以及Wind资讯等,个别数据出现统计缺失,以插值法、回归法等方法进行补齐。

2 主要研究方法

为避免主观和单一评价,采用主成分分析和熵值法结合加权秩和比法(WRSR)对云南省乡村振兴水平进行综合评价,以客观反映乡村发展情况。

2.1 主成分分析

主成分分析可用于对多指标数据信息进行浓缩,通过提取主成分进行主成分得分和综合得分的计算。关键步骤包括:

第一步,利用z-score法则对原始数据进行处理,进一步将多个分析指标浓缩成几个概括性指标,即主成分;

第二步,利用方差解释率进行主成分的权重计算;

第三步,在上述基础上,结合主成分得分情况,计算得到综合得分。

2.2 熵值法

熵值法依据数据本身的信息量进行客观赋权,最终测算出云南省乡村振兴发展水平综合指数。熵值法进行测度评价的具体步骤如下:

第一步,对n年m个指标归一化处理。考虑各项指标计量单位不完全统一,在进行综合指标计算前,先对各类子指标从绝对量转为相对量,以解决不同质指标值的同质化问题。因本文构建的指标体系均为正向指标(见表1),统一采取以下最大最小法则算法进行归一化处理:

其中,i表示年份顺序,j表示各具体子指标i=1,2,…n;j=1,2,…m;xij,yij分别代表原始和归一化后的指标数据。

第二步,计算第j项指标的熵值ej。

易知,熵值ej≥ 0。

第三步,计算各项指标的权重wj。

其中dj=1-ej,表示信息熵冗余度,即信息效用值,该值越大对应指标权重越高。

第四步,计算不同年份下指标的综合得分sj。

2.3 秩和比法

秩和比(RSR)分析算法广泛应用于医疗卫生领域多指标综合评价,使用RSR法综合评价不同医院的医疗水平情况并且进行医疗水平排名和分档次[7]。本文将RSR算法应用于云南省历年来乡村振兴发展水平的排序。RSR秩和比法共需五步,分别是RSR值计算、RSR分布计算、模型构建拟合、分档排序临界值和分档排序结果。其中,关键步骤包括:

一是编秩次。对指标进行秩次的排序,计算频数、累计频数、平均秩次以及向下累计频率值,查《百分比与概率单位对照表》以确定所对应的概率单位值Probit[8];

二是RSR值的拟合值。将上一步得到的Probit值作为自变量X,将RSR分布值作为因变量Y进行线性回归模型拟合,并结合此回归方程计算RSR值的拟合值,用于最终的分档排序;

三是分档排序。结合分档排序临界值0,得到最终不同年份的分档等级Level,Level数字越大,代表等级越好。

3 实证结果与分析3.1 主成分测算结果

本文利用z-score法则对20个二级指标的原始数据进行标准化处理,并进行Bartlett 球形度检验,结果显示p值小于0.5,表明可以进一步做主成分分析。通过主成分分析过程得到各评价指标的特征值、贡献率以及累积贡献率,并据此提取2个主成分,具体见表2。

表2 主成分提取

表2显示主成分分析共提取出2个主成分,特征根值均大于1,此2个主成分的方差解释率分别是81.901%、9.940%,累积方差解释率为91.841%。此时,可计算出各主成分加权后方差解释率,即权重依次为:

81.901/91.841=89.18% 9.940/91.841=10.82%

进一步,根据公式:线性组合系数=成分载荷数/sqrt(特征根),计算得到2个主成分下各指标的系数,结合标准化后的数据得到2个主成分得分及综合得分,得分越高则表明当年乡村振兴程度就越高,结果如表3所示。

表3 主成分得分和综合得分

3.2 熵值法测算结果

依据最大最小法则,对所有原始指标数据进行归一化处理。根据前文所述关于熵值法的应用步骤,依次计算出各个指标的信息熵值、信息效用值以及权重系数,结果如表4所示。

表4 二级指标的信息熵值、信息效用值以及权重系数

进一步,依据表4的权重系数,结合归一化后的数据,加权计算出乡村振兴历年的综合指数,数值越大代表当年乡村振兴水平越高,结果如表5所示。

表5 熵值法下测算乡村振兴综合指数

依据表4和表5的结果数据可知,与主成分分析相比,熵值法下2010年与2011年的排名顺序有细微差异,其余年份的排序高度一致。这表明,云南省乡村振兴水平整体上呈现良好的向上势头,乡村建设和产业发展不断得以提升。

3.3 基于秩和比法的等级评价

为进一步探讨乡村振兴发展情况与相关政策的提出时点是否存在必然联系,本文采用秩和比法进行综合排序,并根据不同时间段进行归档。

在主成分和熵值法计算过程中,可分别得到一级指标的权重,利用加权后的一级指标数据进行WRSR分析,考察两种评价方法下乡村振兴发展水平的RSR值、RSR分布值、Probit值以及回归模型中RSR拟合值,结果如表6所示。

表6 两种评价方法下乡村振兴发展水平RSR拟合值及分档等级(Level)

表6中两处RSR拟合值是根据各自的回归方程计算得出,该回归模型中因变量是表格中RSR分布值,自变量是Probit值。分档等级Level是依据分档排序临界值表格给出,Level数字越大,代表等级越好。

结果显示,在两种评价方法下,尽管RSR拟合值存在着细微差别,但是最终的分档等级是一致的。从Level数值结果来看,2011年云南省乡村振兴水平存在小幅回落,但是整体上是稳步上升的;从2019年开始,云南省乡村发展有了质的提高,整体水平大幅度上升,这表明我国2017年提出的乡村振兴战略计划,确实对云南省农村地区产生了积极的推动力。

4 结语

乡村振兴战略的全面实施有利于解决我国长久以来的“三农”问题,有利于实现全民共同小康。现有文献对于云南省乡村振兴问题的定量研究比较匮乏,极少数文献利用专家打分等主观评价模型估算了乡村振兴综合指数。本文首先构建了包含5项一级指标、20项二级指标的云南省乡村振兴综合评价体系;其次,分别采用主成分和熵值法测算乡村振兴发展水平,并对两种方法进行比较;最后,利用加权秩和比法测算出Level数值并进行归档。结果显示:

(1)两种测算乡村振兴发展水平的方法,仅在2010年和2011年的排名上有细微差异,其余年份排序高度一致;

(2)两种方法计算结果均表明云南省近十年乡村发展稳步前进;

(3)秩和比法得到的分档等级显示:从2019年起,云南省乡村振兴水平显著提升,表明乡村振兴战略的提出对于云南省农村地区的发展产生了积极影响。

本文旨在利用不同评价方法多维度测算云南省乡村振兴发展水平。此外,在计算综合指数的过程中, 5个一级指标及20个二级指标的权重也相应给出,管理者可以根据权重的大小判定其对乡村振兴发展的贡献力度,以此提出更有针对性的规划建议。

标签:  乡村 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。