基于GEE随机森林算法的永仁县光伏方阵提取及分布特征研究

known 发布于 2025-07-17 阅读(207)

摘" " 要:为准确掌握永仁县光伏电站具体建设年度、占地规模、分布规律等,基于谷歌地球引擎(GEE)云平台,通过Sentinel-2影像及云南天地图最新影像用目视解译标注了143个光伏方阵建成区及40个非光伏方阵建成区。提取了Sentinel-2影像6个原始波段、5个植被指数、8个纹理特征,并通过数字高程模型(DEM)提取了3个地形因子,共22个建模参数训练了随机森林模型,提取了永仁县光伏方阵数据。研究结果表明,截至2024年5月,永仁县集中式光伏电站光伏方阵占地面积约为1091.25hm2。

关键词:GEE;随机森林;Sentinel-2影像;光伏方阵

中图分类号:TP751" " " " " " " " " 文献标识码:A" " " " " " " 文章编号:1005-7897(2025)03-0193-03

0" 引言

永仁县是云南省太阳能最佳开发区域之一,早在2012年既已建设了楚雄州第一座、云南省第二座光伏电站——维的太阳能光伏电站[1]。近年来,在国家“双碳”重大战略和云南省新能源规划的基础上,永仁县结合自身区位、资源优势,大力发展光伏产业,并对光伏方阵用地这种新的土地利用方式进行了要求。根据《关于支持光伏发电产业发展规范用地管理有关工作的通知》(自然资办发〔2023〕12号)[2],光伏方阵用地不得改变地表形态,以第三次全国国土调查及后续开展的年度国土变更调查成果为底版,依法依规进行管理。实行用地备案,不需按非农建设用地审批。但光伏方阵实际用地面积并不好做到精确统计,亟须通过遥感等技术手段提取县域范围内光伏方阵用地情况,以便准确、及时掌握不同时间段光伏方阵建设情况,为主管部门提供决策依据。

近年来,通过遥感影像对县域范围或更大空间尺度光伏电站提取的研究也逐渐增多。Feng[3]等提供了2020年我国10m空间分辨率的大型地面光伏电站遥感衍生数据集;刘芸等[4-5]基于高分卫星影像,并基于规则的面向对象分类、最邻近法的监督分类及CART分类器的监督分类等3种不同分类方法,对威宁县光伏电站提取进行了研究;陈雨艳[6]等提出了一种基于深度学习的多源高分辨率遥感影像提取新方法DAˉUNet,并以石林彝族自治县作为测试区域,精度较高。

通过深度学习提取光伏方阵虽然精度较高,但所采用影像时限性较大(多为2年前的影像),不能实时反映光伏方阵建设情况。Sentinel-2是高分辨率多光谱成像卫星(可见光分辨率为10m),两颗卫星互补后的重访周期约为5天,能很好地解决提取光伏方阵的时限性问题。同时谷歌地球引擎(GEE)云平台可直接调用Sentinel-2影像、数字高程模型(DEM)数据集等进行批量建模和处理。

本文在前人研究的基础上,结合2024年5月Sentinel-2影像和最新云南天地图影像,在ArcGIS平台标注了样本并上传至GEE云平台,然后训练了随机森林模型,提取了研究区最新光伏方阵数据,导出后在ArcGIS平台转换为矢量数据,并以缓冲区的方式改进了椒盐噪声消除方法(原论文采用卷积算法,会带来一定误差),然后逐一进行目视检验将误提为光伏方阵的区域进行剔除,得到研究区最终的光伏方阵数据并对光伏方阵建设年度、占地规模、分布规律等进行了分析。通过调用模型并更改不同年度,提取了不同时期光伏方阵数据,以最终的2024年光伏方阵数据为基础,对研究区不同光伏方阵建设年度进行了对比分析。

1 研究区概况

永仁县地处云南省中北部,位于东经101°14′~101°49′,北纬25°51′~26°30′,海拔为926~2884m,地势西北高,东南低,中部地区有广阔的丘状高原面,地势开阔平缓。永仁县境内属亚热带丘陵季风气候,受金沙江沿岸河谷地区热源的影响,形成了冬无严寒,夏无酷暑,冬春干旱,夏秋多雨,干湿分明,雨量偏少,光照充足的独特气候特征。永仁县平均降水量为833.9mm,降雨期集中在6—10月,雨季降水量占年度的94%,干季11月至次年的5月降水量仅占全年的6%。永仁县年平均日照时数长,太阳辐射量多,是云南省开发集中式光伏电站的理想区域。

2" 数据来源与研究方法

GEE平台接入了Landsat、Sentinel-2等卫星影像及ALOS World 3D-30m分辨率DEM数据,能快速、高效地对卫星影像、DEM数据进行预处理和数据组合。

Sentinel-2是高分辨率多光谱成像卫星(可见光分辨率为10m),同一地区重访周期约为5天,可通过GEE官方提供的代码便捷导出研究区的无云影像图。

“天地图·云南”平台提供了云南省时空影像,可在线浏览2024年逐月历史影像。影像分辨率为1m,已建成光伏方阵在云南天地图历史影像上纹理特征明显、轮廓清晰,通过目视解译很容易分辨。

通过GEE导出研究区2024年5月Sentinel-2影像后,在ArcGIS平台将其与云南天地图历史影像作对照,对研究区光伏方阵进行标识,共标识了143个光伏方阵面层(PV),并在光伏方阵周边选择了城镇建设用地、村庄、耕地、林地、草地等40个面积较大的非光伏方阵面层(noPV),以供后期随机森林模型建模对照使用。

随机森林算法在统计学理论基础上进行建模,在分类问题上具有很高的精度且对异常值(噪声)有一定的容忍度,GEE为随机森林算法提供了很好的支持。在GEE中对研究区Sentinel-2影像去云预处理后获取6个原始波段(B2、B3、B4、B8、B11、B12)后,再分别计算5个植被指数(NDVI、MNDWI、NDPI、NDBI、SAVI)、8个纹理特征(ASM、CONTRAST、CORR、VARI、IDM、SAVG、ENT、DISS),并通过ALOS World 3D-30m分辨率DEM数据提取了3个地形因子(ELEVATION、SLOPE、ASPECT),将上述22个建模参数合并为一个数据集。通过将标注的143个PV、40个noPV面层上传至GEE平台后,用GEE中ee.FeatureCollection.randomPoints命令在143个光伏方阵和40个非光伏方阵内随机生成1000个PV点及1000个noPV点,按点提取数据集中对应数据,再按7:3比例划分训练集和验证集,用ee.Classifier.smileRandomForest命令训练、调整模型参数,并进行精度验证,再用训练好的模型对研究区PV数据进行提取后导出。

因提取的PV数据有较多的椒盐噪声,需进行噪声去除以便提高数据精度。将导出的PV栅格数据添加至ArcGIS平台,先用栅格转矢量工具将数据转为PV矢量数据并计算椭球体面积,再将PV矢量数据进行缓冲区分析(为控制电力输送成本,不同光伏方阵间距离一般不会太远,通过多次测试后最终确定缓冲距离为100m)得到PV-100数据,最终对PV-100数据进行融合、拆分多部件后,用连接功能(基于空间位置另一图层的数据,汇总属性选最大值)与PV矢量数据进行空间连接,筛选最大面积大于0.5hm2(为控制建设成本及效益,单个光伏方阵面积一般不会太小,通过多次测试后最终确定面积为0.5hm2)的图斑,得到PV-100-0.5数据,按位置选择位于PV-100-0.5数据中的原始PV矢量即得到初步PV数据,以云南天地图历史影像作对照,对剩余噪声进行剔除即得到最终PV数据。

3" 结果与分析

研究结果表明,永仁县光伏电站建设在近2年增长较快,截至2024年5月,永仁县集中式光伏电站光伏方阵占地面积约为1091.25hm2。

3.1" 光伏方阵建设时间、分布区域分析

研究区已建设光伏方阵在2021年之前维持在202.75hm2(分布在维的乡、莲池乡2个乡镇),2022年开始爆发式增长,截至2024年5月面积达1091.25hm2,共分布在莲池乡、维的乡、宜就镇、永定镇、永兴傣族乡等5个乡镇。研究区历年已建成光伏方阵面积统计如表1所示。

3.2" 光伏方阵地形因子分析

在ArcGIS平台将DEM数据用表面分析工具计算坡度、坡向后,把光伏方阵按Sentinel-2影像分辨率转换为点层,并与DEM原始数据、坡度、坡向进行叠加分析。

通过点层与DEM原始数据叠加分析发现,光伏方阵分布海拔在1200~2000m,其中光伏方阵像元点在1500~1600m分布最多,占比达38%。表2为研究区光伏方阵像元点按海拔统计。

通过点层与DEM计算的坡度叠加分析发现,光伏方阵架设坡度在0°~50°,其中光伏方阵像元点坡度小于20°的最多,占比达89%;光伏方阵像元点坡度大于30°的占比较低,主要位于光伏方阵边缘且不连片,因坡度过大施工、维护成本过高与实际不符,经分析该部分主要是DEM数据存在一定误差引起的。表3为研究区光伏方阵像元点按坡度统计。

通过点层与DEM计算的坡向叠加分析发现,光伏方阵架设坡向各坡向均有涉及,但主要分布在阳坡,少部分光伏方阵分布在阴坡(经分析坡度较小,5°以内),可通过适当提高北侧光伏方阵支架的方式将光伏方阵调整为南朝向。其中,东南坡向、南坡向、西南坡向的光伏方阵像元点最多,共计占比达69%。研究区光伏方阵像元点按坡向统计如表4所示。

4" 结论

研究表明,GEE随机森林算法能很好地提取出光伏方阵范围(模型总体精度为0.95,Kappa系数为0.90),且通过最新影像训练的模型,更改不同Sentinel-2影像成像时间仍可以得到较高的精度。

研究区光伏电站建设在近2年内呈增长较快,主要是国家、云南省政策利好及光伏电站单位面积建设成本降低等因素的影响,吸引了更多企业更愿意投资光伏电站。

光伏方阵分布海拔在1200~2000m,坡度主要分布在20°以下,朝向以南为主。光热效果、日照时长更好的干热河谷区域并未发现建设,主要原因是河谷两岸坡度较大,施工、维护成本均较高导致的。

通过GEE随机森林模型虽然能快速提取到光伏方阵且精度超过90%,但Sentinel-2影像分辨率仅为10m,给光伏方阵边界提取带来一定误差。永仁县正在推广分布式光伏,但通过GEE随机森林很难被提取到,可能需要采取更高分辨率影像通过神经网络模型进行提取,以准确掌握研究区全部光伏电站数据,供主管部门更好地决策,并为其他地区光伏研究提供参考。

参考文献

[1]" 云南省人民政府.楚雄州大抓产业主攻工业突破园区:加快绿色能源与绿色制造融合发展示范区建设[A/OL].(2023-03-21)[2024-10-15]. https://www.yn.gov.cn/ywdt/zsdt/202303/t202303 21_256620.html.

[2]" 自然资源部办公厅,林草局办公室,能源局综合司.关于支持光伏发电产业发展规范用地管理有关工作的通知(自然资办发〔2023〕12号)[A/OL].(2023-03-20)[2024-10-15]. https://www.gov.cn/zhengce/zhengceku/2023-04/03/content_5749824.htm.

[3]" FENG Q L, NIU B W, REN Y, et al. A 10ˉm nationalˉscale map of groundˉmounted photovoltaic power stations in China of 2020[J]. Scientific Data, 2024(11):" 198.

[4]" 刘芸,宋善海,李慧璇,等.基于高分卫星影像的复杂山区光伏电站信息提取[J].中低纬山地气象,2023,47(3):88-92.

[5]" 刘芸,杨娟,黄林峰,等.基于高分卫星影像的威宁县光伏电站提取及分布特征分析[J].能源与环保,2024,46(2):204-208,215.

[6]" 陈雨艳,张军,张俊,等.自适应多源遥感影像的地面光伏提取方法[J].遥感信息,2024,39(3):136-143.

作者简介:王畅(1979— ),男,汉族,云南昆明人,本科,工程师,主要从事林业和草原调查规划工作。

标签:  方阵 

免责声明

本文来自网络,不代表本站立场。如有不愿意被转载的情况,请联系我们。