地统计学方法.ppt
《地统计学方法.ppt》由会员分享,可在线阅读,更多相关《地统计学方法.ppt(126页珍藏版)》请在课桌文档上搜索。
1、2023/3/23,1,地统计学方法,2023/3/23,2,设想一下这样的问题,?,这块地的土壤养分情况如何?不仅需要知道一个总体情况而是要知道每个地方的不同含量方便为那些含量低的地方施肥该怎么办呢?,2023/3/23,3,方案一,Step1:密集采样Step2:把土样运回实验室Step3:晒干,磨碎,.化学分析耗时,耗力,耗财得到的是点状数据面状连续分布呢?未采样地的状况如何呢?,2023/3/23,4,方案二,算法分析,2023/3/23,5,实例:,(a)有机质,(b)全氮,(c)有效磷,2023/3/23,6,1.1 地统计学的发展和概念,一、地统计学发展简史地统计学(Geosta
2、tistics)是20世纪50年代初在南非采矿业中为了计算矿石储量而发展应用起来的,首先被采矿工程师Krige和统计学家Sichel应用于南非的采矿工作中。50年代后期,法国Matheron在此基础上提出了区域化变量理论,形成了地统计学的基本框架。,2023/3/23,7,地统计学发展简史,70年代,计算机的出现,这项技术被引入到地学领域。1975年在罗马举行了关于该学科的第一个国际性会议后,陆续有多个相关国际会议举行。我国的地统计学研究和应用是1977年由侯景儒、黄竞先等首先进行的。现已广泛运用于地质、土壤、农业、气象、海洋、生态、森林和环境治理等方面,2023/3/23,8,二、地统计学的
3、概念,定义:地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性,或空间相关性和依赖性的自然现象的科学。(王政权,1999),2023/3/23,9,1.2 地统计学的应用(土壤),土壤属性的空间分布特征是土壤污染治理、土地管理和现代农业的重要依据之一。土壤是一个形态和过程都相当复杂的自然综合体,成土过程中不同的物理、化学、生物等因素的影响,使得土壤性质具有高度的空间异质性。人类活动进一步加剧了土壤属性的变异性和不确定性。同时,土壤本身处于一个时刻变化的动态过程,因此,对土壤空间性质进行描述和定律研究相当困难。,2023/3/23,10,1.2 地统
4、计学的应用(土壤),自上世纪七八十年代地统计学引入土壤学研究中以来,随着学科发展和应用方向的扩展,地统计学方法已经成为土壤学特别是大尺度土壤学研究的一个重要工具。地统计学在土壤物理性质空间变异中的应用地统计学在土壤化学性质空间变异中的应用地统计学在土壤重金属污染空间变异中的应用地统计学在采样策略中的应用地统计学在其他特性中的应用,2023/3/23,11,地统计学在土壤物理性质空间变异中的应用,湖北咸宁据:罗勇,陈家宙,2008,土壤容重空间变异,土壤饱和导水率空间变异,2023/3/23,12,地统计学在土壤化学性质空间变异中的应用,(a)有机质,(b)全氮,(c)有效磷,(d)速效钾,湖北
5、沙洋据:杨勇,贺立源,2010,2023/3/23,13,地统计学在土壤重金属污染空间变异中的应用,武汉市东湖高新技术开发区据:张贝,杨勇,2010,2023/3/23,14,1.3 地统计学在土壤科学中的应用展望,地统计学和土壤多源数据的处理 利用多源的相关数据预测目标属性的分布地统计学和土壤过程的空间建模 利用多源数据模拟土壤发生发展的过程 地统计学和土壤特性的不确定性模拟 土壤属性超过某一阈值的概率地统计学和土壤过程的时空变异 地统计学与精确农业土壤综合特性的空间变异性研究,2023/3/23,15,样本数据的统计分析和预处理,描述性统计频数分布:直方图集中趋势的度量:平均数、中位数、众
6、数离散型度量:极差、方差偏度和峰度数据检验和分布分析异常值的识别和处理:平均值加标准差法、四倍法正态分布的检验方法:直方图法、PP、QQ、数据转换处理:对数转换、平方根转换、反正弦转换相关分析和回归分析回归分析相关分析,2023/3/23,16,区域化变量,当一个变量呈空间分布时,称之为“区域化”。这种变量常常反映某种空间现象的特征,用区域化变量描述的现象称之为区域化现象。如生态学、土壤学和地质学中许多研究的变量都具有空间分布的特点,实质上都是区域化变量。在研究区域内所有点处的样品数据的实测值就是一个区域化值,其相应的函数z(x)就是一个区域化变量,也是该区域随机模型(函数)Z(x)的一个实现
7、。,2023/3/23,17,平稳假设,1、平稳性:表示当将既定的n个点的点集从研究区域某一处移向另一处时,随机函数的性质保持不变,也称为平移不变性。即随机函数分布的规律性不因位移而改变,是严格平稳的,具有平稳性。,2023/3/23,18,二阶平稳性假设,2、二阶平稳性假设(弱平稳性假设):随机函数的均值为一常数,且任何两个随机变量之间的协方差依赖于它们之间的距离和方向,而不是它们的确切位置:条件1:,数学期望:反映随机变量取值的集中特征,是随机变量取得数字的代表数。该条件表示:在整个研究区内,区域化变量的数学期望对任意x存在,且等于常数,2023/3/23,19,二阶平稳性假设,条件2:在
8、整个研究区内,区域化变量的协方差函数对任意x和h存在,且平稳,即:,协方差:两个不同参数之间的方差就是协方差,用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。期望值分别为E(X)=与 E(Y)=的两个实数随机变量X与Y之间的协方差定义为:COV(X,Y)=E(X-E(X)(Y-E(Y),若两个随机变量X和Y相互独立,则他们的协方差为0。,2023/3/23,20,本征假设,条件1:条件2:,r(h)称为半方差函数,也叫变异函数本征假设是地统计学中对随机函数的基本假设事实上,当作用于大区域时,本征假设的第一个条件很难满足,空间变异的漂移或趋势面可能存在,由于这
9、种漂移,第二个条件也不能满足,但地统计学理论的基础是本征假设,因此,有必要去认识一个随机过程是否是平稳性的,在研究区域内,区域化变量Z(x)的增量的数学期望对任意x和h存在且等于0,在研究区域内,区域化变量的增量Z(x)-Z(x+h)的方差对任意x和h存在且平稳,2023/3/23,21,平稳假设,就严格性而言:平稳性假设二阶平稳性假设本征假设本征假设是地统计学中对随机函数的基本假设,2023/3/23,22,变异函数和协方差函数,变异函数和协方差函数存在以下关系:,2023/3/23,23,协方差具体计算方法,设Z(x)为区域化随机变量,并满足二阶平稳条件,h为两样本点空间分割距离,Z(xi
10、)和Z(xi+h)分别是Z(x)在空间位置xi和xi+h上的观测值,则协方差函数的计算公式为:,N(h)是分隔距离为h时的样本对数总数,2023/3/23,24,变异函数具体计算方法,公式:,值分别是:4,3,4,5,7,9,7,8,7,7,则:,2023/3/23,25,2023/3/23,26,2023/3/23,27,变异函数散点图,2023/3/23,28,变异函数的理论拟合模型,理论变异函数用来拟合一些列经验变异函数值,供后续进行插值估计时使用。选用理论变异函数模型是,要根据经验半方差图的性状来选取合适的模型,2023/3/23,29,变异函数的理论拟合模型,变异函数的理论模型:有基
11、台值模型无基台值模型,2023/3/23,30,有基台值模型球状模型,C0:块金常数C0+C:基台值C:拱高a:变程应用最广的模型,2023/3/23,31,有基台值模型指数模型,C0:块金常数C0+C:基台值C:拱高3a:变程当C0=0,C=1时,称为标准指数函数模型,2023/3/23,32,有基台值模型高斯模型,C0:块金常数C0+C:基台值C:拱高:变程当C0=0,C=1时,称为标准高斯函数模型,2023/3/23,33,三种常用模型比较,0.95,2023/3/23,34,有基台值模型线性有基台值模型,C0:块金常数C0+C:基台值C:拱高A:常数,表示直线斜率当C0=0,C=1时,
12、称为标准指数函数模型,2023/3/23,35,有基台值模型纯块金效应模型,2023/3/23,36,无基台值模型线性无基台值模型,2023/3/23,37,无基台值模型幂函数值模型,2023/3/23,38,无基台值模型对数值模型,2023/3/23,39,套合模型,在实际中,有时区域化随机变量Z(x)的变化相当复杂,往往包含各种尺度及各种层次的变化,反映在变异函数r(h)上,就是单一的模型结构不能将其合理表达,而是多层次的结构相互叠加在一起,地统计学上称为套合。所谓套合结构,就是把分别出现在不同距离h上或不同方向上同时起作用的变异性组合起来,对全部有效的结构信息,作定量化的概括,以表示区域
13、化变量的主要特征。,2023/3/23,40,套合模型,土壤是一个不均与、具有高度空间异质性的复合体,它与土壤母质、气候、水文、地形和生物等因素有关,分析土壤空间变异的因素,可将其变异分为系统变异(土壤形成因素相互作用造成)和随机变异(可以观测到的,但与土壤形成印务无关且不能直接分析的)两大类。如由h分开的两个点x和x+h的土壤某一性质Z(x)和Z(x+h)。当h趋近于0时,可以认为两点间的差异完全是由取样和测定误差造成,当h逐步增大,如h1m,差异可能还要加上诸如水分等因素,当h100m时,在新的变异要考虑地形的作用。,2023/3/23,41,套合模型,当h一定时,变异函数r(h)应包含小
14、于h的所有影响因素,因此,绝大多数变异函数都由下面两个变异函数组成:r(h)=r0(h)+r1(h),即一个代表纯块金方差,一个代表空间相关的方差。一般情况下,套合模型可以用放映各种不同尺度变化的多个变异函数之和表示,即:,ri(h)可以是相同的或不同的理论模型,2023/3/23,42,套合模型,如,区域化变量Z(x)的变异性由r0(h),r1(h)和r2(h)组成,其中,2023/3/23,43,套合模型,三者组成的套合模型为:,2023/3/23,44,套合模型,2023/3/23,45,最优拟合参数最优估计,变异函数的理论模型主要是曲线模型,将曲线模型经过适当的变换,化为线性模型,然后
15、用最小二乘法原理求未知参数的估计。,2023/3/23,46,基于优化搜索算法的参数拟合,对于结构复杂的变异函数理论模型,特别是套合结构模型,参数复杂,难以用一般的通用方法求解出模型中的参数。但一些智能优化算法,如遗传算法、模拟退火算法、蚁群算法能够使用统一的流程求解出接近最优的参数。,2023/3/23,47,基于遗传算法的变异函数理论模型参数估计,1、多尺度套合模型的规范表达,2023/3/23,48,基于遗传算法的变异函数理论模型参数估计,从上式可以看出,需求解的参数为2n+1个(因为第一个模型总是纯块金模型)。而在实际计算时,可以令,这样方便从经验半方差图中识别 ci取值区间。并有以下
16、约束:,2023/3/23,49,基于遗传算法的变异函数理论模型参数估计,编码策略及初始群体产生假设需要顾及m(m=2n+1)个参数,每个参数的取值范围和估值精度分别是Umin,Umax和Qi,则将m个参数分别以L1,L2,Lm为长度进行二进制编码,其中则每条染色体长度为,染色体中每个参数编码对应的解码 公式为:,以这种编码方式随机产生T组染色体,2023/3/23,50,基于遗传算法的变异函数理论模型参数估计,确定个体适应度评价函数,2023/3/23,51,基于遗传算法的变异函数理论模型参数估计,遗传操作遗传算法主要包括3个基本算子,即选择、交叉和变异,为此,需确定交叉概率Pc和变异概率P
17、m,3个过程执行以后,将产生新一代种群,并记录适应度最高的染色体,2023/3/23,52,主要空间插值法简介,分类:确定性方法:基于实测数据的相似性程度或平滑程度,利用数学函数进行插值(如逆距离加权法)地统计方法:利用实测数据的统计特性来量化其空间自相关程度,生产插值面并评价预测的不确定性,2023/3/23,53,主要空间插值法简介,分类:整体插值法:利用整个实测数据集来预测局部插值法:在大面积的研究区域上选取较小的空间单元,利用预测点周围的临近样点来进行预测,2023/3/23,54,空间整体插值法,1、全局多项式插值法(趋势面分析法):即用数学公式表达感兴趣区域上的一种渐变的趋势。平面
18、:曲面:多项式中的参数系数往往用最小二乘法求解。但该方法是不精确的插值方法,很少有实测点刚好在生产的插值面上,而是或高或低于插值面,高低数值相加,之和近似为0。,2023/3/23,55,空间整体插值法,全局多项式插值法的插值结果往往呈条带状(左图),适合于描述那些呈明显趋势分布的属性,不适合描述那些空间分布波动较大(较破碎,右图)的自然属性,2023/3/23,56,空间整体插值法,2、变换函数插值法:根据一个或多个空间参量的经验方程进行整体空间插值,这种经验方程称为变换函数。即用与被预测属性相关的其他属性建立回归方程,进行空间预测:,b0,b1,b2为回归系数,p1,p2为独立空间变量,z
19、(x)为被预测属性,2023/3/23,57,空间局部插值法,1、泰森多边形插值:由一组连续多边形组成,多边形的边界是由相邻两点直线的垂直平分线组成。,特性:(1)每个多边形内仅包含一个离散数据点。(2)在多边形内的任一点k(x,y)同Pi(xi,yi)之间距离总小于它同其它离散点Pj(xj,yj)之间距离。(3)泰森多边形的任意一个顶点必有三条边与它连接,这些边是相邻三个泰森多边形两两拼接的公共边。(4)泰森多边形的任意一个顶点周围存在三个离散点,将其连成三角形后其外接圆的圆心即为该顶点,该三角形称泰森三角形,2023/3/23,58,空间局部插值法,各泰森多边形内的每一点属性均由各多边形内
20、的已知点确定,若求数据域内任意一点数据属性Z(xi,yi),则需首先判断待求点所落入的多边形,然后再由控制该多边形的已知点Z(x,y)推算得到。,2023/3/23,59,空间局部插值法,2、三角测量插值法:将采样点用直线与其相邻点连接成三角形,三角形内部包括任何样点,形成一个包括多个倾斜三角板的多面体(TIN),未测点只可能在三角形内或三角形边线上,利用线性插值即可求得缺点是每个预测值只是根据三个实测值得到,且有时会产生突变现象,2023/3/23,60,空间局部插值法,3、逆距离加权法(IDW):利用被预测区域点周围的实测值来预测未采样点的值,实测点离预测点越近,则对插值的结果影响越大。其
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 方法
链接地址:https://www.desk33.com/p-248028.html