首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 156 毫秒
1.
为探讨小流域尺度丘陵区的高分辨率数字土壤制图方法,通过对景观相分类的探索,配合应用不同尺度的Geomorphons(GM)微地形特征数据构成分类变量组参与高分辨率土壤pH、黏粒含量和阳离子交换量的预测制图,并与传统数字高程模型衍生变量和遥感变量进行组合与比较分析。此外,采用支持向量机、偏最小二乘回归和随机森林3种机器学习模型择优与残差回归克里金复合参与预测模型的构建与评价。结果表明: 景观及多尺度微地形分类变量组的应用分别提高小流域尺度丘陵地貌区pH、黏粒含量和阳离子交换量预测精度的18.8%、8.2%和8.7%。包含植被信息的景观相分类图相比土地利用数据有更高的模型贡献度;5 m分辨率的GM微地形分类图相比低分辨率的分类图更适宜高精度的预测制图。黏粒含量使用随机森林复合模型有最高的预测精度,而pH和阳离子交换量则不适宜在随机森林模型的基础上加入残差回归克里金模型。景观-多尺度微地形分类变量、数字高程模型衍生变量和遥感变量三者结合的模型预测表现最佳,表明多元变量在起伏地形区域相比单一数据源能够包含更多的土壤有效信息。由GM数据和地表景观数据组成的景观分类变量组作为主要变量能够解释小流域丘陵区部分土壤属性约40%的空间变异。在同类型土壤预测制图研究中,多分辨率GM及景观分类数据有潜力作为环境变量参与预测模型的构建。  相似文献   

2.
探究全球生态系统动力学调查(GEDI)多波束激光雷达数据估测区域森林郁闭度(FCC)的潜力,对于评估森林生态系统状态和林分环境具有重要作用。选取滇西北典型生态脆弱区香格里拉为研究区,以GEDI波形数据为信息源,提取46245个有林地光斑参数,使用经验贝叶斯克里金法(EBK)获取光斑参数在研究区未知空间的连续分布,结合54块实测样地数据,采用支持向量机的递归特征消除法(SVM-RFE)、随机森林(RF)和Pearson分析分别优选特征变量,基于贝叶斯优化(BO)随机森林回归模型(BO-RFR)、贝叶斯优化梯度回归模型(BO-GBRT)和偏最小二乘法(PLSR)研建森林郁闭度最佳估测模型。结果表明:(1)EBK法预测精度高,估测结果可靠,R2:0.20-0.92,RMSE:0.004-2812.912,MAE:0.003-1996.258,MRE:0.007-4.423;(2)基于不同特征优选方法筛选的特征变量和数量略有差异,SVM-RFE 法优选出6个参数(cover、pai、sensitivity、rv_a1、rv_a4、rg_a4)的平均交叉验证精度达0.84,RF法以贡献度5%为阈值筛选出5个参数(cover、pai、pgap_theta_error、modis_treecover、modis_nonvegetated),Pearson法以相关性大于0.3且在0.01水平显著优选出5个参数(cover、pai、rv_a5、rg_a5、pgap_theta_error);(3)不同特征变量优选方法筛选的建模参数研建估测模型精度差异性较大,以SVM-RFE和RF方法优选参数构建估测模型的精度更佳,SVM-RFE方法优选参数研建估测模型精度变化相对稳定,以 RF方法中的BO-GBRT模型为最佳FCC估测模型(R2=0.85、RMSE=0.069,P=86.5%);(4)采用BO-GBRT模型估测研究区森林郁闭度和空间制图,与GEDI pai参数预测的FCC具有较高空间相关性达0.53,FCC均值分别为0.58、0.61,主要分布在0.4-0.7,分别占比65.45%、51.79%。研究区森林郁闭度主要处于中度郁闭,北部区域主要为高度郁闭区,与研究区植被覆盖度的空间分布具有一致性,说明使用GEDI数据估测森林郁闭度的方法具有可行性、结果具有可靠性。研究为使用GEDI数据高效、及时、低成本估测大空间尺度的森林水平结构参数的相关研究奠定了基础。  相似文献   

3.
遥感是从田块到区域乃至全球范围无损探测叶面积指数(LAI)的有效方法。土壤背景是LAI遥感研究的重要制约因素之一,而土壤类型是组成土壤背景的主要部分,对植被冠层-土壤的光学性质有重要影响,但目前植冠下土壤类型背景对遥感LAI估算的影响尚不明确。该文通过分析归一化差异植被指数、修正型土壤调节植被指数、修正的叶绿素吸收比率指数、红边拐点、红边振幅、红边面积、红边对数指数和归一化差异光谱指数在不同土壤类型下对LAI的敏感性,挖掘最不敏感的光谱参数;通过比较两种回归模型(偏最小二乘回归和随机森林回归)在单一土壤类型和多种土壤类型区对LAI的预测精度,探究将单一土壤类型下发展的LAI估算模型应用到复杂土壤类型地区时可能出现的问题。结果表明:(1)虽然8种光谱指数对LAI的敏感性因土壤类型不同而差异明显,但红边拐点受植冠下土壤类型影响最小;"lambda-by-lambda"波段优选算法不仅可以提供对LAI最敏感的光谱区间,而且可在一定程度上为抵抗植冠下土壤类型差异影响的光谱指数构建提供可行思路;(2)回归模型的LAI预测精度因是否考虑土壤类型而不同,但在小区域尤其是田块尺度研究时,对变量的解释能力是选择模型的第一考虑,而偏最小二乘回归在此方面优于随机森林回归;在未知地表先验知识的前提下,随机森林回归对大区域LAI估算比偏最小二乘回归适合,但地表先验知识的获取对LAI遥感估算仍然十分必要。  相似文献   

4.
土壤阳离子交换量(CEC)是土壤施肥、改良的主要依据和土壤质量的评价指标,研究土壤CEC的空间分布及模型预测可为土壤养分监测、管理及精准农业实施提供科学依据。本研究以中宁枸杞林地粉壤土为对象,在自相关、交互相关等分析基础上,采用协同克里格(CoKriging)、普通最小二乘法(OLS)、地理加权回归(GWR)和随机森林(RF)模型对土壤CEC进行回归分析,比较了制图效果及模型预测精度。结果表明:中宁枸杞林地粉壤土CEC平均值为13.12 cmol·kg^-1,属中等肥力;土壤CEC的空间分布具有自相关性,并与土壤pH、有机质、黏粒和电导率在不同滞后距离上存在不同的空间相互关系;RF模型预测图避免了CoKriging、OLS和GWR模型预测图中土壤CEC图斑边界两侧破碎程度大、突变明显的缺陷,使土壤CEC在空间变化上表现为自然、平缓的过渡;RF模型RMSE值分别比CoKriging、OLS和GWR模型减少33.82%、20.55%和19.81%,R^2分别提高8.84%、51.92%和7.69%。RF模型考虑了样点空间位置,明显提高了插值精度且制图效果更加平缓。  相似文献   

5.
土壤阳离子交换量(CEC)是土壤施肥、改良的主要依据和土壤质量的评价指标,研究土壤CEC的空间分布及模型预测可为土壤养分监测、管理及精准农业实施提供科学依据。本研究以中宁枸杞林地粉壤土为对象,在自相关、交互相关等分析基础上,采用协同克里格(CoKriging)、普通最小二乘法(OLS)、地理加权回归(GWR)和随机森林(RF)模型对土壤CEC进行回归分析,比较了制图效果及模型预测精度。结果表明:中宁枸杞林地粉壤土CEC平均值为13.12 cmol·kg~(-1),属中等肥力;土壤CEC的空间分布具有自相关性,并与土壤pH、有机质、黏粒和电导率在不同滞后距离上存在不同的空间相互关系; RF模型预测图避免了CoKriging、OLS和GWR模型预测图中土壤CEC图斑边界两侧破碎程度大、突变明显的缺陷,使土壤CEC在空间变化上表现为自然、平缓的过渡; RF模型RMSE值分别比CoKriging、OLS和GWR模型减少33.82%、20.55%和19.81%,R~2分别提高8.84%、51.92%和7.69%。RF模型考虑了样点空间位置,明显提高了插值精度且制图效果更加平缓。  相似文献   

6.
柳生吉  杨健 《生态学杂志》2013,32(6):1620-1628
林火分布模型是在较大区域上描述林火空间分布的强有力工具,并可以确定影响林火分布的控制因子.本研究基于黑龙江省1996-2006年的历史火烧记录数据,分别采用广义线性模型和最大熵模型分析了地形、人类活动和土地覆被类型等环境控制因子对黑龙江省林火空间分布的影响,并比较了模型预测精度、评价环境变量重要性及预测火点概率分布图等.结果表明:两个模型的预测精度达中等水平,而最大熵模型的预测精度要略高于广义线性模型.总体而言,与人类活动相关的变量是林火分布模型最佳的环境变量,地形变量次之.尽管两个模型在预测精度和环境变量重要性方面都有很大的相似性,但最大熵模型产生的火点概率图空间格局与广义线性模型产生的明显不同.本研究说明,为了更加精确地确定森林火灾发生的热点地区,应该采用不同模型进行比较,或者有选择性地进行组合以产生综合的预测结果,从而为森林防火工作提供更加合理高效的建议.  相似文献   

7.
林火是森林生态系统的重要影响因子,建立科学准确的林火预测预报模型对林火管理工作至关重要。本研究以不同气象因子为主要预测变量,基于Logistic回归和广义线性混合效应模型建立福建省林火发生预测模型,通过对比Logistic基础模型和广义线性混合效应模型的拟合度和预测精度,研究混合效应模型在林火预报中的适用性。结果表明: Logistic基础模型的受试者工作特征曲线下面积(AUC)值为0.664,验证准确率为60.4%。添加随机效应后,模型的拟合和检验精度均获得了提升。其中,考虑行政区划和海拔差异效应的两水平混合效应模型的表现最优,其AUC值和验证准确率分别比基础模型提升0.057和6.0%。用此混合效应模型对福建省各地区的林火发生概率进行预测的结果表明,福建省西北部和南部为林火中高发区域,西南部和东部为林火低发区域,与实际观测的火点分布一致。混合效应模型在数据拟合和林火发生预测方面均优于Logistic基础模型,可作为林火预测和管理的重要工具。  相似文献   

8.
基于微波遥感技术探测森林地表土壤含水率   总被引:3,自引:0,他引:3  
森林地表土壤含水率是森林生态系统中的重要参数,使用微波遥感技术快速准确地估算区域尺度上的森林地表土壤含水率,对于森林生态系统研究具有重要的现实意义.本文利用TDR-300土壤含水率速测仪测得黑龙江大兴安岭地区塔河林业局盘古林场内120块样地的森林地表土壤含水率作为因变量,利用C波段全极化SAR数据的极化分解参数作为自变量,构造多元线性回归统计模型和BP神经网络模型,定量估测森林地表土壤含水率,通过模型反演获得区域尺度上森林地表土壤含水率的空间分布.结果表明: 多元线性回归统计模型的精度为86.0%,均方差根误差(RMSE)为3.0%;BP神经网络模型的精度为89.4%,RMSE为2.7%.说明利用BP神经网络模型定量估测森林地表土壤含水率优于多元线性回归模型,将全极化SAR数据通过BP神经网络模型进行仿真,最终得到研究区域的森林地表土壤含水率空间分布图.  相似文献   

9.
随机森林模型在分类与回归分析中的应用   总被引:25,自引:0,他引:25  
李欣海 《昆虫知识》2013,50(4):1190-1197
随机森林(random forest)模型是由Breiman和Cutler在2001年提出的一种基于分类树的算法。它通过对大量分类树的汇总提高了模型的预测精度,是取代神经网络等传统机器学习方法的新的模型。随机森林的运算速度很快,在处理大数据时表现优异。随机森林不需要顾虑一般回归分析面临的多元共线性的问题,不用做变量选择。现有的随机森林软件包给出了所有变量的重要性。另外,随机森林便于计算变量的非线性作用,而且可以体现变量间的交互作用(interaction)。它对离群值也不敏感。本文通过3个案例,分别介绍了随机森林在昆虫种类的判别分析、有无数据的分析(取代逻辑斯蒂回归)和回归分析上的应用。案例的数据格式和R语言代码可为研究随机森林在分类与回归分析中的应用提供参考。  相似文献   

10.
为了采用广义加法模型整合数字高程模型和遥感数据进行植被分布的预测, 并探索耦合环境变量和遥感数据作为预测变量是否能够有效地提高植被分布预测的精度, 选择海拔、坡度、至黄河最近距离、至海岸线最近距离, 以及从SPOT5遥感影像中提取的光谱变量作为预测变量, 采用广义加法模型整合环境变量和光谱变量, 建立植被分布预测模型。研究设置3种建模情景(以环境变量作为预测变量, 以光谱变量作为预测变量, 综合使用环境变量与光谱变量作为预测变量)对黄河三角洲的优势植被类型的分布进行了预测, 并对预测结果采用偏差分析、受试者工作特征曲线和野外采样点对比等3种方法进行了验证。结果表明: (1)基于广义加法模型的植被分布预测方法具有一定的实用性, 可以较为准确地预测植被的分布; 盖度较高的植被类型预测精度较高, 盖度较低的植被类型预测精度较低, 植物群落结构的特点是出现这些差异的主要原因; 综合使用环境变量和光谱变量作为预测变量的模型, 预测精度高于单独以环境变量或者光谱变量作为预测变量的模型。(2)环境变量、光谱变量大多被选入模型, 二者均对植被分布预测有重要的作用; 同一预测变量在不同植被类型的预测模型中的贡献不同, 这与植被的光谱、环境特征差异有关; 同一预测变量在不同的建模情景下对模型的贡献不同, 环境变量与光谱变量的耦合效应可能是导致预测变量对模型的贡献出现变化的原因。  相似文献   

11.
我国林火发生预测模型研究进展   总被引:2,自引:0,他引:2  
通过文献回顾,总结了国内林火发生预测模型的研究现状,并从林火发生驱动因子、林火发生概率预测模型、林火发生频次预测模型和模型检验方法等方面进行归纳分析。得出以下结论: 1)气象、地形、植被、可燃物、人类活动等因素是影响林火发生及模型预测精度的主要驱动因子;2)林火发生概率模型中,地理加权逻辑斯蒂回归模型考虑了变量之间的空间相关性,Gompit回归模型适宜非对称结构的林火数据,随机森林模型不需要多重共线性检验,在避免过度拟合的同时提高了预测精度,是林火发生概率预测模型的优选方法之一;3)林火发生频次模型中,负二项回归模型更适合对过度离散数据进行模拟,零膨胀模型和栅栏模型可以处理林火数据中包含大量零值的问题;4)ROC检验、AIC检验、似然比检验和Wald检验方法是林火概率和频次模型的常用检验方法。林火发生预测模型研究仍是我国当前林火管理工作的重点,预测模型的选择需要依据不同地区林火数据特点。此外,构建林火预测模型时需要考虑更多的影响因素,以提高模型预测精度;未来,需要进一步探索其他数学模型在林火发生预测中的应用,不断提高林火发生预测模型的准确度。  相似文献   

12.
Mapping the distribution and quantity of soil properties is important for black soil protection, management, and restoration in northeastern China. The objective of this study was to evaluate the effect of the spatial resolution on soil pH mapping using satellite images of the black soil region in northeastern China. A high spatial resolution Gaofen (GF)-2 high-definition image and multispectral images acquired by the Landsat 8 operational land imager and Sentinel-2 multi-spectral instrument were used to compare their performance in soil pH prediction. The spectral variables, including the original bands of the three satellite images and a variety of spectral indices derived from the original bands, were employed. Then, a machine learning model (quantile regression forest) was used to determine the relationships between the spectral variables and the measured soil pH, and prediction models were established to estimate the soil pH and to characterize the spatial pattern of the soil pH. The results revealed that the soil pH prediction model based on the GF-2 image had a slightly higher prediction accuracy than the models constructed using the Landsat 8 and Sentinel-2 images. The prediction models for Landsat 8, Sentinel-2, and GF-2 had root mean square errors of 0.34, 0.39, and 0.31, respectively. The use of remote sensing images with a high spatial resolution may not substantially increase the prediction accuracy of soil pH mapping compared with the results derived from medium-resolution images.  相似文献   

13.
Forests are living dynamic systems and these unique ecosystems are essential for life on earth. Forest fires are one of the major environmental concerns, economic, and social in the worldwide. The aim of current research is to identify general indicators influencing on forest fire and compare forest fire susceptibility maps based on the boosted regression tree (BRT), generalized additive model (GAM), and random forest (RF) data mining models in the Minudasht Township, Golestan Province, Iran. According to expert opinion and literature review, fifteen condition factors on forest fire have been selected in the study area. These are slope degree, slope aspect, elevation, topographic wetness index (TWI), topographic position index (TPI), plan curvature, wind effect, annual temperature and rainfall, soil texture, distance to roads, rivers, and villages, normalized difference vegetation index (NDVI), and land use. Forest fire locations were identified using MODIS images, historical records, and extensive field checking. 106 (≈70%) locations, out of 151 forest fires identified, were used for models building/training, while the remaining 45 (≈30%) cases were used for the models validation.BRT, GAM, and RF data mining models were used to distinguish between presence and absence of forest fires and its mapping. These algorithms were used to perform feature selection in order to reveal the variables that contribute more to forest fire occurrence. Finally, for validation of models, the area under the curve (AUC) for forest fire susceptibility maps was calculated. The validation of results showed that AUC for three mentioned models varies from 0.7279 to 0.8770 (AUCBRT = 80.84%, AUCGAM = 87.70%, and AUCRF = 72.79%,). Results indicated that the main drivers of forest fire occurrence were annual rainfall, distance to roads, and land use factors. The results can be applied to primary warning, fire suppression resource planning, and allocation work.  相似文献   

14.
基于数字土壤制图技术的土壤有机碳储量估算   总被引:2,自引:0,他引:2  
精准的土壤属性空间分布信息有助于提升土壤有机碳储量估算的精度。本研究以河南省济源市南山林场为研究区,以地形因子为预测因子,利用模糊C均值(FCM)聚类方法对土壤有机碳含量、土壤容重、土壤厚度和土壤砾石含量进行数字土壤预测制图,基于数字制图结果实现土壤有机碳密度预测制图和土壤有机碳储量估算。结果表明: 基于数字土壤制图方法得到的研究区土壤有机碳密度平均值为4.24 kg·m-2,其预测图的平均误差(ME)为0.08 kg·m-2,平均绝对误差(MAE)为2.80 kg·m-2,均方根误差(RMSE)为5.03 kg·m-2,与传统类型方法相比,预测结果的精度和稳定性更高,具有较高的可信度,最终估算得到研究区土壤有机碳储量为3.08×108 kg。基于数字土壤制图技术仅采用少量土壤样点即可实现较高精度的土壤有机碳密度制图和储量估算,且能表征土壤有机碳密度空间分布特征。本研究为土壤有机碳储量估算提供了新途径,有助于提升土壤有机碳储量估算的精度和效率。  相似文献   

15.
不同土地利用类型下土壤光谱信息存在差异,了解不同土地利用类型下合适的建模方法可以高效准确地进行土壤有机碳含量反演。本研究以江西省奉新县中北部林地、耕地和园地3种土地利用类型共248个土壤样本为对象,首先对土壤原始光谱反射率曲线使用Savitzky-Golay(SG)滤波去噪并进行10 nm重采样减少数据冗余,之后采用偏最小二乘回归(PLSR)、基于网格搜索法的支持向量机回归(GRID-SVR)和基于粒子群算法的支持向量机回归(PSO-SVR)3种方法分别构建土壤有机碳含量的反演模型。结果表明: 构建单一土地利用类型反演模型时,PLSR方法在林地、耕地和园地的相对分析误差(RPD)分别为1.536、1.315和1.493,采用GRID-SVR方法时,其RPD分别提升0.150、0.183和0.502。采用PSO-SVR方法时精度最高,相较GRID-SVR方法,其林地、耕地和园地的RPD分别提高20.8%、10.0%和2.7%,林地和园地的RPD分别为2.036和2.049,可以极好地预测土壤有机碳含量,耕地的RPD为1.647,可以对土壤有机碳含量进行粗略估测。PSO-SVR方法对不同土地利用类型土壤有机碳反演效果最优,林地和园地土壤有机碳含量的反演精度相近且高于耕地。研究区不同土地利用类型对土壤有机碳含量的反演结果存在一定的影响,今后可以考虑在反演土壤有机碳时分不同土地利用类型进行建模。  相似文献   

16.
In biomedical research, the logistic regression model is the most commonly used method for predicting the probability of a binary outcome. While many clinical researchers have expressed an enthusiasm for regression trees, this method may have limited accuracy for predicting health outcomes. We aimed to evaluate the improvement that is achieved by using ensemble‐based methods, including bootstrap aggregation (bagging) of regression trees, random forests, and boosted regression trees. We analyzed 30‐day mortality in two large cohorts of patients hospitalized with either acute myocardial infarction (N = 16,230) or congestive heart failure (N = 15,848) in two distinct eras (1999–2001 and 2004–2005). We found that both the in‐sample and out‐of‐sample prediction of ensemble methods offered substantial improvement in predicting cardiovascular mortality compared to conventional regression trees. However, conventional logistic regression models that incorporated restricted cubic smoothing splines had even better performance. We conclude that ensemble methods from the data mining and machine learning literature increase the predictive performance of regression trees, but may not lead to clear advantages over conventional logistic regression models for predicting short‐term mortality in population‐based samples of subjects with cardiovascular disease.  相似文献   

17.
生物量转换和扩展因子(BCEFs)是估算森林生物量碳储量普遍使用的重要参数.厘清BCEFs估算差异的来源,可降低森林生物量碳储量评估的不确定性.利用基于集成学习的决策树模型能够很好地解决BCEFs估算差异来源问题.然而,不同此类模型的对比研究目前尚未见报道.本研究以第8次国家森林资源清查福建省331块马尾松的固定样地数据作为材料,分别利用增强回归树(BRT)、随机森林(RF)和立体派(Cubist)模型分析BCEFs(包括地上和地下部分)估算差异的来源.结果表明: 研究区马尾松BCEFs呈右偏分布,平均值为0.69 t·m-3,最小值为0.67 t·m-3,最大值为0.71 t·m-3.BRT、RF和Cubist模型对BCEFs的拟合和预测能力均很好,均能够解释92.8%以上的BCEFs变异.3种模型均给出了相同的前2个相对贡献率最大的自变量,为平均胸径和蓄积量.BCEFs随着平均胸径、蓄积量的增加呈逐渐减小的趋势.平均胸径、蓄积量、平均年龄和平均树高等林分特征因子对BCEFs的影响极大,而土壤因子和地形因子对BCEFs的影响均很小.在建立BCEFs模型时,利用平均胸径、蓄积量、平均年龄和平均树高等少量包含较多BCEFs预测信息的变量便能获取很好的预估精度.当应用固定BCEFs时,应选择在平均年龄、平均胸径以及蓄积等方面具有广泛代表性的样本计算BCEFs.  相似文献   

18.
近年来,我国近海多种重要渔业资源处于不同程度的衰退状态,而短蛸具有生命周期短、生长迅速的特点,在我国近海经济渔获产量中占重要地位。然而,有关短蛸的栖息分布特征及其与环境因子的关系尚缺乏研究,不利于更好地保护和利用其资源。本研究根据2011年和2013—2017年春季海州湾的渔业资源和环境因子调查数据,采用随机森林模型、人工神经网络模型和广义提升回归模型3种机器学习方法分析了短蛸的栖息分布特征及其与环境因子的关系。结果表明: 随机森林模型的拟合效果和预测能力在3种模型中优势较大,选择该模型进行分析表明,底层水温、水深和底层盐度对短蛸的栖息分布有较大影响。短蛸的相对资源密度随底层水温、水深和底层盐度的增加均呈先上升后下降趋势。根据FVCOM模型模拟的环境数据,应用随机森林模型预测了短蛸在海州湾海域的栖息分布,发现短蛸主要分布在34.5°—35.8° N、119.7°—121° E之间的海域。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号