摘 要:【目的】研究土壤高光谱数据经不同形式变换后与不同建模方法构建土壤有机质与全氮估测模型的精度,建立快速、稳定的估测模型,为现代化农业生产的精准施肥提供科学依据。【方法】以新疆博尔塔拉蒙古自治州(简称博州)耕地土壤为研究对象,在暗室中使用ASD Field4地物光谱仪测量处理后的土壤样品光谱。将原始光谱进行断点拟合与Savitzky-Golay(S-G)平滑滤波校正处理,对校正后光谱(R)进行一阶导数(First Derivative,FD)、对数的一阶导数(First derivative of logarithmic,(lgR))、倒数的一阶导数(First derivative of reciprocal,(1/R))、多元散射校正(Multipication scatter correction,MSC)4种变换,分析5种光谱数据与土壤有机质和全氮含量,筛选特征波段,基于特征波段运用偏最小二乘回归(PLSR)、BP神经网络(BP)和随机森林(RF)3种方法,分别建立土壤有机质、全氮的估测模型并评价模型的精度与稳定性。【结果】光谱经不同变换后,与土壤有机质和全氮的相关系数有所提高,且特征波段更为明显,一阶导数与倒数的一阶导数变换优于其他变换,FD-PLSR模型预测有机质精度最高,Rv2、RPD分别为0.89、2.63;(1/R)-PLSR模型预测土壤全氮精度最高,Rv2、RPD分别为0.83、2.42。【结论】基于高光谱技术与机器学习模型可以估测博州耕地土壤的有机质与全氮含量。
关键词:高光谱;土壤有机质;土壤全氮;光谱估测;偏最小二乘回归;随机森林
中图分类号:S15 文献标志码:A 文章编号:1001-4330(2024)10-2491-09
收稿日期(Received):2024-04-15
基金项目:农业科技创新稳定支持专项(xjnkyywdzc-2022002)
作者简介:李嘉琦(1995-),男,河南鹤壁人,硕士研究生,研究方向为土壤肥料与农业信息技术应用,(E-mail)515815502@qq.com
通讯作者:耿庆龙(1982-),男,山东人,副研究员,硕士,研究方向为土壤肥料与农业信息技术应用,(E-mail)564819139@qq.com
0 引 言
【研究意义】近年来土壤质量的评估和监测成为农业可持续发展和生态环境保护的研究领域之一。土壤有机质(Soil Organic Matter,SOM)和全氮(Total Nitrogen,TN)是土壤肥力和生态系统功能的关键指标,在土壤质量评价和土壤管理中具有重要意义。传统的土壤有机质和全氮测定方法通常需要耗费大量时间和精力,并且在实际应用中存在一定的局限性。因此,开发一种快速、准确的土壤有机质和全氮估测方法显得尤为重要[1-3]。【前人研究进展】基于高光谱技术的土壤有机质和全氮估测方法逐渐受到关注[4-7],对光谱的不同预处理可影响预测模型的精度。Liu等[8]通过偏最小二乘方法,建立了土壤反射率和吸光度与土壤有机质含量之间的估测模型。王一丁等[9]通过对光谱数据SG滤波平滑处理结合偏最小二乘回归,建立了豫中烟区潮褐土有机质和全氮含量的高光谱估测模型。杜军等[10]研究发现,以二阶微分光谱变换结合径向基函数为核函数的支持向量机模型反演土壤全氮效果最佳。Chang等[11]利用原始光谱的一阶微分结合偏最小二乘法构建了土壤全氮含量的预测模型,模型R2为0.87,RPD为2.79,此模型可精确地估测土壤全氮含量。王海江等[12]以新疆北疆棉田土壤为研究对象,基于偏最小二乘和支持向量机构建的模型均较好地估测氮素含量。高光谱技术利用从可见光至近红外波段的连续光谱信息,捕捉土壤中有机物和氮元素的光谱反射特征。通过建立高光谱与土壤样品中有机质和全氮含量之间的关系模型,实现对土壤有机质和全氮含量的快速测定。【本研究切入点】高光谱估测技术具有较多的局限性,如不同土壤样品的复杂性,人为操作光谱仪器误差等均影响所构建估测模型的精度。因此,需进一步优化和改进基于高光谱的土壤有机质和全氮估测方法,提高其预测精度和实际应用能力。【拟解决的关键问题】以博州耕地土壤为研究对象,通过对土壤光谱数据的多种形式变换,结合土壤养分数据筛选特征波段,并建立偏最小二乘回归(PLSR)、BP神经网络(BP)和随机森林(RF)三种估测模型,为博州土壤质量的改善和农业生产与发展工作提供技术支撑。
1 材料与方法
1.1 材 料
新疆博州位于新疆西北部,准噶尔盆地西端(79 53′~83 53′E,44 02′~45 23′N)。地势西高东低,地形由南、北、西逐渐向中、东部倾斜,并似喇叭状逐渐开阔。耕地土壤主要以潮土、棕钙土、灰漠土、和草甸土为主。主要种植小麦、玉米、棉花和油料等作物。博州属北温带大陆性干旱气候,春季气温回升快且不稳定,夏季炎热,秋季降温迅速,冬季寒冷,日照充足,太阳总辐射年均5 390~5 700MJ/m2,年均降水量为90~500 mm。
1.2 方 法
1.2.1 土壤样品采集与制备
2021年于博州采集土壤样品,采样点选取基于2021年博州耕地质量调查评价监测样点,监测样点按667 hm2(1×104亩)耕地布设一个点位。使用梅花采样法,共采集294个土壤样品,采样深度为0~20 cm,取1 kg左右土样装于土样袋,记录采样点位信息。采回样品进行晾干、磨细并通过60目(0.25 mm)孔筛,每份样品采用四分法分成两份,一份用于实验室测定土壤有机质、全氮含量,另一份用于土壤高光谱数据的采集。土壤采样点分布图利用AcrGIS10.7制作。
1.2.2 土壤样品处理
在室内实验室测定土壤养分信息,土壤有机质含量测定采用重铬酸钾氧化-外加热法(LY/T1237—1999),土壤全氮含量测定采用凯氏定氮法(LY/T1228—2015)。
在室内利用ASD Field4地物光谱仪采集土壤光谱,该地物光谱仪的波长范围是350~2 500 nm,共输出2 151个波段,在350~2 500 nm区间范围的重采样间隔为1 nm。土壤样品的光谱测量在干燥的暗室中进行,将土样过60目孔筛后,置于直径90 mm、深20 mm的培养皿中,装满后将土样表面刮平。每次光谱测量之前将仪器提前打开预热30 min并进行白板校正,使用仪器配套的手持接触式探头垂直置于土壤表面测量。选择培养皿中3个平均分布的点位,每个点位分别测量10条光谱反射率数据,单个样本共采集30条反射率数据。在测量过程中,每测量10份土壤样品进行1次标准白板校正。
1.2.3 建模与模型评价
基于特征波段建模的模型精度和稳定性优于全波段建模的结果[13-18],仅分析特征波段的模型效果。对272个样本按照采样编号排序,在MATLAB中按照7∶3比例随机划分建模集与验证集参与后续模型分析,以5种光谱形式分别与偏最小二乘回归(PLSR)、BP神经网络(BP)和随机森林(RF)三种建模方法分别建立土壤有机质、全氮的估测模型,每类组合建模9次,选取验证集决定系数(Rv2)中值对应的建模结果作为该类组合最终结果进行分析评价。三种模型的建立在Matlab2022a中完成。
土壤有机质和全氮估测模型的评价指标采用决定系数(coefficient ofdetermination, R2)、均方根误差(root mean square error, RMSE)、相对分析误差(the ratio of prediction todeviation, RPD)。决定系数R2越接近于1,模型的预测能力越强。均方根误差RMSE用来衡量数据的离散程度,RMSE越小模型的精度越高。当RPD≥2时模型具有较好的预测能力;当1.4≤RPD<2时,模型可对样品作粗略估测;当RPDlt;1.4时模型无法对样品进行预测[19-20]。
1.3 数据处理
利用ViewspecPro软件对所测得的光谱数据进行断点拟合。从ViewspecPro中计算每个样本的30条反射率数据的算术平均值作为该样本的实际反射率数据,导出实际反射率数据至Excel中,为消除仪器噪声影响,去除350~399 nm和2 451~2 500 nm波段的数据。利用Matlab2022a软件对反射率数据进行Savitzky-Golay(S-G)平滑滤波处理得到土壤光谱(R),对土壤光谱进行一阶导数(First Derivative,FD)、对数的一阶导数(First derivative of logarithmic,(lgR))、倒数的一阶导数(First derivative of reciprocal,(1/R))、多元散射校正(Multipication scatter correction,MSC)4种变换,并将5种光谱数据分别与实验室所土壤有机质与全氮数据进行相关性分析筛选特征波段,相关性分析在SPSS24中进行,光谱曲线图在Origin2021中绘制。对所获得的养分数据,采用箱线图法剔除22个养分值异常的样本,得到272个样本用于建模分析。
2 结果与分析
2.1 有机质和全氮含量变异系数梯度分布
研究表明,有机质含量最小值为5.66 g/kg,最大值为31.7 g/kg,均值为18.09 g/kg,总体含量处于中等偏低水平。全氮含量最小值为0.29 g/kg,最大值为5.66 g/kg,均值为1 g/kg,总体含量处于中等水平。有机质和全氮含量变异系数大,具有较大的梯度分布,样本离散程度高,此类数据构建模型具有良好的代表性。表1
2.2 土壤光谱曲线变化趋势
研究表明,所有土壤光谱曲线变化趋势相同,波长与反射率呈正相关状态,其中在400~760 nm波段光谱反射率增加较快,在760~2 400 nm波段光谱反射率增加变缓,土壤有机质及全氮含量与光谱反射率呈负相关,此外还受多种因素影响。MSC变换土壤光谱曲线在1 400、1 900和2 200 nm处有明显的波谷。图1
2.3 土壤有机质含量与变换后的相关性比较
研究表明,不同变换后的相关系数具有明显差异。土壤有机质与全氮的特征波段范围大致相同,土壤有机质与全氮呈正相关。
土壤有机质及全氮含量与R相关性曲线整体呈负相关,在600 nm波段达到峰值;与FD变换相关性曲线波动较大,存在多处波峰波谷,可凸显土壤光谱特征信息;与(lgR)和(1/R)变换的相关性曲线较FD变换同样存在多处波峰波谷,并且更加明显,体现了特征波段主要集中在424~529、637~892、1 383~1 496和2 187~2 316 nm。采用P<0.01显著性检验筛选特征波段参与后续建模。土壤有机质及全氮含量与MSC变换在可见光波段的相关性达到峰值,然而在1 400和1 900 nm波段的吸收峰。图2~3
2.4 不同预测模型建模预测效果评估
研究表明,基于PLSR的预测模型中,不同光谱处理形式下土壤全氮的Rc2的最大值与最小值为0.82、0.34,RMSEc的最大值与最小值为0.29、0.15 g/kg,Rv2的最大值与最小值为0.83、0.44,RMSEv的最大值与最小值为0.23、0.13 g/kg,RPD介于1.01~2.42;土壤有机质的Rc2的最大值与最小值为0.89、0.66,RMSEc的最大值与最小值为5.91、2.01 g/kg,Rv2的最大值与最小值为0.89、0.42,RMSEv的最大值与最小值为6.24、1.92 g/kg,RPD介于1.21~2.63。
基于SVR的预测模型中,不同光谱处理形式下土壤全氮的Rc2的最大值与最小值为0.64、0.58,RMSEc的最大值与最小值为0.31、0.22 g/kg,Rv2的最大值与最小值为0.64、0.42,RMSEv的最大值与最小值为0.34、0.21 g/kg,RPD介于1.09~1.23;土壤有机质的Rc2最大值与最小值为0.65、0.52,RMSEc最大值与最小值为6.11、2.98 g/kg,Rv2的最大值与最小值为0.62、0.39,RMSEv的最大值与最小值为4.82、3.07 g/kg,RPD介于1.14~1.51。
基于RF的预测模型中,不同光谱处理形式下土壤全氮的Rc2的最大值与最小值为0.72、0.35,RMSEc的最大值与最小值为0.27、0.1 7 g/kg,Rv2的最大值与最小值为0.73、0.17,RMSEv的最大值与最小值为0.25、0.17 g/kg,RPD介于1.12~1.84;土壤有机质的Rc2的最大值与最小值为0.86、0.56,RMSEc的最大值与最小值为3.70、1.31 g/kg,Rv2的最大值与最小值为0.85、0.41,RMSEv的最大值与最小值为4.21、1.16 g/kg,RPD介于1.18~2.31。
除MSC变换外,其他光谱变换均可提高模型的预测性与稳定性。PLSR模型的R2与RPD均高于SVR和RF模型,且RMSEc与RMSEv较小,其中使用倒数的一阶导数光谱变换构建的PLSR模型预测土壤全氮效果最佳,Rv2与RPD达到0.83、2.42;使用一阶导数光谱变换构建的PLSR模型预测有机质效果最佳,Rv2与RPD达到0.89、2.63。SVR模型的效果不佳,只能粗略估算全氮与有机质的含量。RF模型效果良好,其中使用一阶导数变换构建的全氮估测模型Rv2与RPD达到0.73、1.84;一阶导数变换构建的有机质估测模型Rv2与RPD达到0.85、2.31。表2~4,图4~5
对全氮预测效果最好的光谱变换及模型是(1/R)-PLSR,对有机质预测效果最好的光谱变换及模型是FD-PLSR。图5
3 讨 论
3.1 为提高对土壤光谱的分析速度与精准度,采用相关分析法筛选特征波段[21-22],相较于谢文等[23]采用土壤光谱全波段信息段构建模型,试验研究方法减少了全波段中的冗余信息,利于多种模型的构建。多个研究也采用相关分析法选取特征波段构建模型,并取得了较好的估测效果[24-25]。
3.2 相较于张娟娟等[26]对原始光谱进行单一形式变换,试验研究进行了更多种类的数学变换,其中原始光谱经一阶导数变换后,光谱吸收特征显现出来,土壤有机质及全氮含量与光谱反射率的相关性均被提高。试验研究发现对数的导数与倒数的导数变换后的光谱进一步凸显了土壤养分的特征波段,多种数学变换组合下处理的土壤光谱也可以提取出不同的光谱特征,与于锦涛等[27]的研究结果一致。多元散射校正后的光谱数据与土壤养分的相关系数曲线更清晰地显示了水分吸收影响的波段。
相较于刘杰亚等[28]只构建单一估测模型,构建了3种估测模型,PLSR和RF模型能够有效预测土壤有机质及全氮的含量,而SVR模型仅能粗略估测,相较于原始光谱构建的模型,三种数学变换后的光谱构建的模型预测精度均有明显提升,说明合适的光谱变换可以提高模型的预测精度和稳定性[29],而MSC光谱变换后预测效果不佳,可能是该变换弱化了与土壤养分有关的光谱波段[30]。
4 结 论
以博州272个土样为研究对象,以土壤有机质与全氮含量结合土壤光谱反射率及其四种变换形式进行相关分析筛选特征波段,并利用两种土壤养分的不同特征波段分别建立基于PLSR、SVR、RF的预测模型。不同光谱变换构建的预测模型精度不同,(1/R)-PLSR模型预测土壤全氮精度最高,Rv2、RPD分别为0.83、2.42。FD-PLSR模型预测有机质精度最高,Rv2、RPD分别为0.89、2.63。高光谱技术与机器学习模型相结合能够构建估测博州耕地土壤有机质与全氮的模型,采用筛选后的光谱波段建模是可行的。
参考文献(References)
[1]沈润平, 丁国香, 魏国栓, 等. 基于人工神经网络的土壤有机质含量高光谱反演[J].土壤学报, 2009, 46(3): 391-397.
SHEN Runping, DING Guoxiang, WEI Guoshuan, et al. Retrieval of soil organic matter content from hyper-spectrum based on ann[J].Acta Pedologica Sinica, 2009, 46(3): 391-397.
[2] 叶勤, 姜雪芹, 李西灿, 等. 基于高光谱数据的土壤有机质含量反演模型比较[J].农业机械学报, 2017, 48(3): 164-172.
YE Qin, JIANG Xueqin, LI Xican, et al. Comparison on inversion model of soil organic matter content based on hyperspectral data[J].Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(3): 164-172.
[3] 张娟娟, 田永超, 朱艳, 等. 不同类型土壤的光谱特征及其有机质含量预测[J].中国农业科学, 2009, 42(9): 3154-3163.
ZHANG Juanjuan, TIAN Yongchao, ZHU Yan, et al. Spectral characteristics and estimation of organic matter contents of different soil types[J].Scientia Agricultura Sinica, 2009, 42(9): 3154-3163.
[4] 洪永胜, 于雷, 耿雷, 等. 应用DS算法消除室内几何测试条件对土壤高光谱数据波动性的影响[J].华中师范大学学报(自然科学版), 2016, 50(2): 303-308.
HONG Yongsheng, YU Lei, GENG Lei, et al. Using Direct Standardization algorithm to eliminate the effect of laboratory geometric parameters on soil hyperspectral data fluctuate characteristic[J].Journal of Central China Normal University (Natural Sciences), 2016, 50(2): 303-308.
[5] 栾福明, 熊黑钢, 王芳, 等. 基于小波分析的土壤碱解氮含量高光谱反演[J].光谱学与光谱分析, 2013, 33(10): 2828.
LUAN Fuming, XIONG Heigang, WANG Fang, et al. The inversion of soil alkaline hydrolysis nutrient content with hyperspectral reflectance based on wavelet analysis[J].Spectroscopy and Spectral Analysis, 2013, 33(10): 2828.
[6] 林楠, 刘海琪, 杨佳佳, 等. BA-Adaboost模型的黑土区土壤养分含量高光谱估测[J].光谱学与光谱分析, 2020, 40(12): 3825-3831.
LIN Nan, LIU Haiqi, YANG Jiajia, et al. Hyperspectral estimation of soil nutrient content in the black soil region based on BA-adaboost[J].Spectroscopy and Spectral Analysis, 2020, 40(12): 3825-3831.
[7] 陈奕云, 齐天赐, 黄颖菁, 等. 土壤有机质含量可见-近红外光谱反演模型校正集优选方法[J].农业工程学报, 2017, 33(6): 107-114.
CHEN Yiyun, QI Tianci, HUANG Yingjing, et al. Optimization method of calibration dataset for VIS-NIR spectral inversion model of soil organ ic matter content[J].Transactions of the Chinese Society of Agricultural Engineering, 2017, 33(6): 107-114.
[8] Liu Y L, Jiang Q H, Fei T, et al. Transferability of a visible and near-infrared model for soil organic matter estimation in riparian landscapes[J].Remote Sensing, 2014, 6(5): 4305-4322.
[9] 王一丁, 赵铭钦, 刘鹏飞, 等. 基于高光谱分析的植烟土壤有机质和全氮含量预测研究[J].中国烟草学报, 2016, 22(3): 44-51.
WANG Yiding, ZHAO Mingqin, LIU Pengfei, et al. Prediction of organic matter and total nitrogen contents in tobacco-growing soil based on hyper-spectral analysis[J].Acta Tabacaria Sinica, 2016, 22(3): 44-51.
[10] 杜军, 古军伟, 邱士可, 等. 基于支持向量回归的土壤全氮含量高光谱估测研究[J].河南科学, 2020, 38(10): 1585-1590.
DU Jun, GU Junwei, QIU Shike, et al. Prediction of total nitrogen by using hyperspectral data based on support vector regression[J].Henan Science, 2020, 38(10): 1585-1590.
[11] Chang C W, Laird D A, Mausbach M J, et al. Near-infrared reflectance spectroscopy–principal components regression analyses of soil properties[J].Soil Science Society of America Journal, 2001, 65(2): 480-490.
[12] 王海江, 刘凡, YUNGER John A, 等. 不同粒径处理的土壤全氮含量高光谱特征拟合模型[J].农业机械学报, 2019, 50(2): 195-204.
WANG Haijiang, LIU Fan, YUNGER J A, et al. Fitting model of soil total nitrogen content in different soil particle sizes using hyperspectral analysis[J].Transactions of the Chinese Society for Agricultural Machinery, 2019, 50(2): 195-204.
[13] 南锋, 朱洪芬, 毕如田. 黄土高原煤矿区复垦农田土壤有机质含量的高光谱预测[J].中国农业科学, 2016, 49(11): 2126-2135.
NAN Feng, ZHU Hongfen, BI Rutian. Hyperspectral prediction of soil organic matter content in the reclamation cropland of coal mining areas in the Loess Plateau[J].Scientia Agricultura Sinica, 2016, 49(11): 2126-2135.
[14] 朱亚星, 于雷, 洪永胜, 等. 土壤有机质高光谱特征与波长变量优选方法[J].中国农业科学, 2017, 50(22): 4325-4337.
ZHU Yaxing, YU Lei, HONG Yongsheng, et al. Hyperspectral features and wavelength variables selection methods of soil organic matter[J].Scientia Agricultura Sinica, 2017, 50(22): 4325-4337.
[15] 杨玉军. 基于机器学习的时间序列模型研究及其应用[D].成都: 电子科技大学, 2018.
YANG Yujun. Research and Application of Time Series Model Based on Machine Learning[D].Chengdu: University of Electronic Science and Technology of China, 2018.
[16] 姚登举, 杨静, 詹晓娟. 基于随机森林的特征选择算法[J].吉林大学学报(工学版), 2014, 44(1): 137-141.
YAO Dengju, YANG Jing, ZHAN Xiaojuan. Feature selection algorithm based on random forest[J].Journal of Jilin University (Engineering and Technology Edition), 2014, 44(1): 137-141.
[17] 赵宁博, 秦凯, 赵英俊, 等. 土壤铬的航空高光谱间接反演模型及可迁移性研究[J].光谱学与光谱分析, 2021, 41(5): 1617-1624.
ZHAO Ningbo, QIN Kai, ZHAO Yingjun, et al. Study on indirect inversion model and migration ability of chromium in soil by aerial hyperspectral method[J].Spectroscopy and Spectral Analysis, 2021, 41(5): 1617-1624.
[18] 郭云开, 谢晓峰, 谢琼, 等. 基于小波变换的土壤重金属铬含量定量反演[J].测绘工程, 2021, 30(3): 66-71.
GUO Yunkai, XIE Xiaofeng, XIE Qiong, et al. Quantitative inversion of heavy metal chromium content in soil based on wavelet transform[J].Engineering of Surveying and Mapping, 2021, 30(3): 66-71.
[19] Chang C W, Laird D A. Near-infrared reflectance spectroscopic analysis of soil C and N[J].Soil Science, 2002, 167(2): 110-116.
[20] 侯化刚, 王丹阳, 马斯琦, 等. 黄河三角洲不同盐渍度土壤有机质含量的高光谱预测研究[J].中国农业科学, 2023, 56(10): 1905-1919.
HOU Huagang, WANG Danyang, MA Siqi, et al. Hyperspectral prediction of organic matter in soils of different salinity levels in the Yellow River Delta[J].Scientia Agricultura Sinica, 2023, 56(10): 1905-1919.
[21] Viscarra Rossel R A, Behrens T. Using data mining to model and interpret soil diffuse reflectance spectra[J].Geoderma, 2010, 158(1/2): 46-54.
[22] 玉米提·买明, 王雪梅. 连续小波变换的土壤有机质含量高光谱估测[J].光谱学与光谱分析, 2022, 42(4): 1278-1284.
Yumiti Maiming, WANG Xuemei. Hyperspectral estimation of soil organic matter content based on continuous wavelet transformation[J].Spectroscopy and Spectral Analysis, 2022, 42(4): 1278-1284.
[23] 谢文, 赵小敏, 郭熙, 等. 基于RBF组合模型的山地红壤有机质含量光谱估测[J].林业科学, 2018, 54(6): 16-23.
XIE Wen, ZHAO Xiaomin, GUO Xi, et al. Spectrum based estimation of the content of soil organic matters in mountain red soil using RBF combination model[J].Scientia Silvae Sinicae, 2018, 54(6): 16-23.
[24] 王婷, 刘振华, 彭一平, 等. 华南地区土壤有机质含量高光谱反演[J].江苏农业学报, 2020, 36(2): 350-357.
WANG Ting, LIU Zhenhua, PENG Yiping, et al. Predicting soil organic matter content in South China based on hyperspectral reflectance[J].Jiangsu Journal of Agricultural Sciences, 2020, 36(2): 350-357.
[25]张恒, 梁太波, 江鸿, 等. 基于高光谱成像的区域尺度植烟土壤有机质含量和pH值估测[J].烟草科技, 2023, 11(17): 1-15.
ZHANG Heng, LIANG Taibo, Jiang Hong, et al. Estimation of organic matter content and pH of regional-scale tobacco-growing soils using hyperspectral imaging [J].Tobacco Science amp; Technology, 2023, 11(17): 1-15.
[26] 张娟娟, 牛圳, 马新明, 等. 基于离散小波的土壤全氮高光谱特征提取与反演[J].光谱学与光谱分析, 2023, 43(10): 3223-3229.
ZHANG Juanjuan, NIU Zhen, MA Xinming, et al. Hyperspectral feature extraction and estimation of soil total nitrogen based on discrete wavelet transform[J].Spectroscopy and Spectral Analysis, 2023, 43(10): 3223-3229.
[27] 于锦涛, 李西灿, 曹双, 等. 土壤有机质高光谱自反馈灰色模糊估测模型[J].山东农业大学学报(自然科学版), 2023, 54(4): 495-499.
YU Jintao, LI Xican, CAO Shuang, et al. Self-feedback grey fuzzy estimation model of soil organic matter using Hyper-spectral data[J].Journal of Shandong Agricultural University (Natural Science Edition), 2023, 54(4): 495-499.
[28] 刘杰亚, 李西灿, 任文静, 等. 利用卷积神经网络的土壤有机质含量高光谱估测[J].河北农业大学学报, 2023, 46(4): 118-124.
LIU Jieya, LI Xican, REN Wenjing, et al. Hyperspectral estimation of soil organic matter content using convolutional neural network[J].Journal of Hebei Agricultural University, 2023, 46(4): 118-124.
[29] 赵明松, 谢毅, 陆龙妹, 等. 基于高光谱特征指数的土壤有机质含量建模[J].土壤学报, 2021, 58(1): 42-54.
ZHAO Mingsong, XIE Yi, LU Longmei, et al. Modeling for soil organic matter content based on hyperspectral feature indices[J].Acta Pedologica Sinica, 2021, 58(1): 42-54.
[30] 王动民, 纪俊敏, 高洪智. 多元散射校正预处理波段对近红外光谱定标模型的影响[J].光谱学与光谱分析, 2014, 34(9): 2387-2390.
WANG Dongmin, JI Junmin, GAO Hongzhi. The effect of MSC spectral pretreatment regions on near infrared spectroscopy calibration results[J].Spectroscopy and Spectral Analysis, 2014, 34(9): 2387-2390.
Estimation of soil organic matter and total nitrogen based on hyperspectral technology
LI Jiaqi1, FENG Yuhua1, CHEN Shuhuang2, WANG Ziao1, LIU Peng1,
LIANG Zhiyong1, SUN Fafu1, CHEN Rong1,GENG Qinglong2
(1. College of Resources and Environment, Xinjiang Agricultural University, Urumqi 830052, China;2.Institute of Soil, Fertilizer and Agricultural Water Conservation, Xinjiang Academy of Agricultural Sciences/Agricultural Remote Sensing Center, Xinjang Academy of Agricultural Sciences, Urumqi 830091 , China)
Abstract:【Objective】 To explore the accuracy of soil organic matter and total nitrogen estimation model with different modeling methods and to establish a fast and stable estimation model, so as to provide scientific basis for precision fertilization of modern agricultural production. 【Methods】 Taking the cultivated soil from Bortala Mongolia Autonomous Prefecture as the research object, the ASD Field4 ground object spectrometer was used to measure the spectrum of the treated soil samples in the dark room. The original spectrum was processed by breakpoint fitting and Savitzky-Golay (S-G) smoothing filtering correction. First derivative (FD), first derivative of logarithm ((lgR)′), first derivative of reciprocal ((1/R)′) and multipication scatter correction (MSC) were performed on the corrected spectrum (R). The correlation analysis of the above five forms of spectra with soil organic matter and total nitrogen content was carried out to screen the characteristic bands. Based on the characteristic bands, partial least squares regression (PLSR), BP neural network (BP) and random forest (RF) were used to establish the estimation models of soil organic matter and total nitrogen, and the accuracy and stability of the models were evaluated. 【Results】 After different transformations, the correlation coefficients between the spectra and soil organic matter and total nitrogen increased, and the characteristic bands were more obvious. The first derivative transformation of the first derivative and the reciprocal was better than those of other transformations. The FD-PLSR model had the highest accuracy in predicting organic matter, with Rv2 and RPD of 0.89 and 2.63, respectively. The (1/R)′-PLSR model had the highest accuracy in predicting soil total nitrogen, with Rv2 and RPD of 0.83 and 2.42, respectively. 【Conclusion】 Based on hyperspectral technology and machine learning model, the estimation of soil organic matter and total nitrogen in cultivated land of Bozhou can be realized.
Key words:hyperspectral; soil organic matter; soil total nitrogen; spectral estimation; partial least squares regression; random forest
Fund projects:Agricultural Science and Technology Innovation and Stability Support Special Project (xjnkyywdzc-2022002)
Correspondence author:GENG Qinglong(1982-), male, from Shandong, associate researcher, research direction: research direction: soil fertilizer and application of intelligence agricultural information technology, (E-mail) 564819139@qq.com