×
热带地理

自然地理学和测绘学论文_基于空间大数据及机器

文章目录

1 材料和方法

1.1 研究区概况

1.2 数据获取

    (1)土壤样本数据采集

    (2)环境因子数据获取

1.3 研究方法

    1.3.1 决策树模型

    1.3.2 随机森林模型

    1.3.3 精度评价

2 结果与分析

2.1 决策树与随机森林的参数最优取值

    2.1.1 决策树参数最优取值

    2.1.2 随机森林参数最优取值

2.2 模型精度影响因子的重要性排序

2.3 空间制图与精度检验

    2.3.1 决策树的空间制图与精度检验

    2.3.2 随机森林的空间制图与精度检验

2.4 地形地貌要素对红壤分布的影响分析

3 讨论与结论

3.1 讨论

    (1)决策树与随机森林模型泛化能力的对比

    (2)影响红壤分布的主要环境变量

3.2 结论

文章摘要:精准的数字化土壤地图及空间属性数据库对于适地适树、适地适种分析,生态环境保护规划和决策,土壤生态系统多样性研究等都具有重要的理论及实践意义。为探索滇中及滇东南地区红壤空间分布,基于机器学习中的决策树和随机森林两种树形模型,利用1 145个样点训练获取了滇东高原红壤与地形地貌、气候、生物等多种环境因子之间的非线性关系,并以250 m为最小栅格单元实现了滇东红壤的空间分布制图;通过31个已知剖面样本进行了模型检验,并与云南省1995年红壤分布图对比。结果显示:(1)决策树算法在验证集上的模型精度为82%,但过拟合严重;(2)使用随机森林算法拟合的验证集模型精度为81.38%,红壤空间分布结果精度为67.74%,与1995年版土壤类型图相比精度提高了9.68%;(3)树形模型中的随机森林算法具有更好的泛化和抗过拟合能力,拟合结果可展现更详细的空间细节和空间变化信息,与云南自然地理环境要素空间格局的吻合度更好,更适合大尺度的数字土壤制图;(4)影响滇东高原红壤分布的主要因素是海拔、温度、地表切割度和地表隆起度。本研究首次尝试了应用树形模型和空间大数据开展复杂山地区域的大尺度土壤类型制图,机器学习方法可以用于我国西南地区大尺度的精准化土壤数字制图。

文章关键词:

项目基金: