
克里金插值(kriging)【知识荟萃】.ppt
107页克里金插值,第二讲,克里金方法(Kriging), 是以南非矿业工程师D.G.Krige (克里格)名字命名的一项实用空间估计技术,是地质统计学 的重要组成部分,也是地质统计学的核心1,行业重点,地质统计学,主要是为解决矿床储量计算和误差估计问题而发展起来的,由法国巴黎国立高等矿业学院G马特隆教授于1962年所创立2,行业重点,H. S. Sichel (1947),D.G. Krige (1951),Kriging法(克里金法,克立格法):“根据样品空间位置不同、样品间相关程度的不同,对每个样品品位赋予不同的权,进行滑动加权平均,以估计中心块段平均品位”,G. Materon(1962),提出了“地质统计学”概念 (法文Geostatistique) 发表了专著应用地质统计学论阐明了一整套区域化变量的理论,为地质统计学奠定了理论基础区域化变量理论 克里金估计 随机模拟,应用统计学方法研究金矿品位,1977年我国开始引入,3,行业重点,克里金插值方法,(普通克里金),(应用随机函数理论),不仅考虑待估点位置与 已知数据位置的相互关 系,而且还考虑变量的 空间相关性4,行业重点,,为一个实值变量,可根据概率分布取不同的值。
每次取值(观测)结果z为一个确定的数值,称为随机变量Z的一个实现一、随机变量与随机函数,第一节 基本原理,1. 随机变量,5,行业重点,连续变量:,累积分布函数(cdf) cumulative distribution function,条件累积分布函数(ccdf)后验 conditional cumulative distribution function,离散变量(类型变量):,Z (u),,不同的取值方式:估计(estimation) 模拟(simulation),6,行业重点,,连续型地质变量,构造深度 砂体厚度 有效厚度 孔隙度 渗透率 含油饱和度,离散型地质变量,(范畴变量),砂体 相 流动单元 隔夹层 断层,类型变量,7,行业重点,设离散型随机变量的所有可能取值为 x1,x2,,其相应的概率为,P (=xk)= pk, k=1,2,.,随机变量的特征值:,(1)数学期望,是随机变量的整体代表性特征数则当级数 绝对收敛时,称此级数的和为的数学期望,记为E(),或EE() =,8,行业重点,设连续型随机变量的可能取值区间为(-,+), p(x)为其概率密度函数,若无穷积分 绝对收敛,则称它为的数学期望,记为E()。
E() =,数学期望是随机变量的最基本的数字特征, 相当于随机变量以其取值概率为权的加权平均数 从矩的角度说,数学期望是的一阶原点矩对于一组样本:,9,行业重点,为随机变量的离散性特征数若数学期望E-E()2存在,则称它为的方差,记为D(),或Var(),或2从矩的角度说,方差是的二阶中心矩2)方差,其简算公式为 D()=E(2) E()2,D()= E-E()2,方差的平方根为标准差,记为,10,行业重点,研究范围内的一组随机变量简记为,随机场:,当随机函数依赖于多个自变量时,称为随机场如具有三个自变量(空间点的三个直角坐标)的随机场,2. 随机函数,条件累积分布函数(ccdf),11,行业重点,二个随机变量,的协方差为二维随机变量(,)的二阶混合中心矩11,记为Cov(,),或,协方差(Variance):,Cov(,) = , = E-E()-E(),其简算公式为 Cov(,) = E ()-E() E(),随机函数的特征值,12,行业重点,二、统计推断与平稳要求,任何统计推断(cdf,数学期望等)均要求重复取样但在储层预测中,一个位置只能有一个样品同一位置重复取样,得到cdf,不现实,13,行业重点,考虑邻近点,推断待估点,空间一点处的观测值可解释为一个随机变量在该点 处的一个随机实现。
空间各点处随机变量的集合构成一个随机函数区域化变量: 能用其空间分布来表征一个自然现象的变量将空间位置作为随机函数的自变量),(可以应用随机函数理论解决插值和模拟问题),14,行业重点,考虑邻近点,推断待估点 ----空间统计推断要求平稳假设,严格平稳,对于单变量而言:,可从研究区内所有数据的累积直方图推断而得 (将邻近点当成重复取样点),太强的假设,不符合实际,15,行业重点,当区域化变量Z(u)满足下列二个条件时,则称其为二阶平稳或弱平稳:,,EZ(u) = EZ(u+h) = m(常数),x,h,随机函数在空间上的变化没有明显趋势, 围绕m值上下波动 在整个研究区内有Z(u)的数学期望存在, 且等于常数,即:,二阶平稳,16,行业重点, 在整个研究区内,Z(u)的协方差函数存在且平稳 (即只依赖于滞后h,而与u无关), 即 CovZ(u),Z(u+h) = EZ(u)Z(u+h)-EZ(u)EZ(u+h) = EZ(u)Z(u+h)- = C(h),,特殊地,当h=0时,上式变为 VarZ(u)=C(0), 即方差存在且为常数。
协方差不依赖于空间绝对位置,而依赖于相对位置 , 即具有空间的平稳不变性17,行业重点,在整个研究区内有 EZ(u)-Z(u+h) = 0,本征假设,当区域化变量Z(u)的增量Z(u)-Z(u+h)满足下列二条件时,称其为满足本征假设或内蕴假设可出现EZ(u)不存在, 但EZ(u)-Z(u+h)存在并为零的情况,intrinsic hypothese,EZ(u)可以变化,但EZ(u)-Z(u+h)=0,(比二阶平稳更弱的平稳假设),18,行业重点, 增量Z(u)-Z(u+h)的方差函数 (变差函数,Variogram) 存在且平稳 (即不依赖于u),即: VarZ(u)-Z(u+h) = EZ(u)-Z(u+h)2-EZ(u)-Z(u+h)2 = EZ(u)-Z(u+h)2 = 2(u,h) = 2(h),,相当于要求:Z(u)的变差函数存在且平稳19,行业重点,例:物理学上的著名的布朗运动是一种呈现出无限离散性的物理现象,其随机函数的理论模型就是维纳-勒维(Wiener-Levy)过程(或随机游走过程) 布朗运动:,可出现协方差函数不存在,但变差函数存在的情况。
既不能确定验前方差,也不能确定协方差函数但是其增量却具有有限的方差: VarZ(x)-Z(x+h) = 2 = A|h| (其中,A是个常数), 变差函数= |h|,且随着|h|线性地增大20,行业重点,若区域化变量Z(x)在整个区域内不满足二阶平稳(或本征假设) ,但在有限大小的邻域内是二阶平稳(或本征)的,则称Z(x)是准二阶平稳的(或准本征的)准二阶平稳假设及准本征假设,21,行业重点,设 为区域上的一系列观测点, 为相应的观测值区域化变量在 处的值 可采用一个线性组合来估计:,三、克里金估计(基本思路,,,,,Z*(x0),,,,无偏 最优,无偏性和估计方差最小被作为 选取的标准,,,----以普通克里金为例,22,行业重点,从本征假设出发, 可知 为常数,有,,,可得到关系式:,,(1)无偏条件,Z*(x0),(在搜寻邻域内为常数,不同邻域可以有差别),23,行业重点,,(2)估计方差最小,,应用拉格朗日乘数法求条件极值,Z*(x0),24,行业重点,,进一步推导,可得到n+1阶的线性方程组, 即克里金方程组,当随机函数不满足二阶平稳,而满足内蕴(本征)假设时,可用变差函数来表示克里金方程组如下:,,Z*(x0),25,行业重点,最小的估计方差,即克里金方差可用以下公式求解:,,,Z*(x0),26,行业重点,变差函数(或叫变程方差函数,或变异函数)是地质统计学所特有的基本工具。
它既能描述区域化变量的空间结构性变化,又能描述其随机性变化跃迁现象,1. 变差函数的概念与参数,四、变差函数及其结构分析,27,行业重点,,假设空间点x只在一维的x轴上变化,则将区域化变量Z(x)在x,x+h两点处的值之差的方差之半定义为Z(x)在x轴方向上的变差函数,记为,一维情况下的定义:,半变差函数(或半变异函数),28,行业重点,在二阶平稳假设,或作本征假设,此时:,地质统计学中最常用的基本公式之一EZ(x)-Z(x+h) = 0,h,,则:,29,行业重点,,(二阶平稳假设条件下边查函数与写防查的关系),30,行业重点,变程(Range) :指区域化变量在空间上具有相关性的范围在变程范围之内,数据具有相关性;而在变程之外,数据之间互不相关,即在变程以外的观测值不对估计结果产生影响31,行业重点,具不同变程的克里金插值图象,32,行业重点,块金值(Nugget) :变差函数如果在原点间断,在地质统计学中称为“块金效应”,表现为在很短的距离内有较大的空间变异性,无论h多小,两个随机变量都不相关 它可以由测量误差引起,也可以来自矿化现象的微观变异性在数学上,块金值c0相当于变量纯随机性的部分。
33,行业重点,如果品位完全是典型的随机变量,则不论观测尺度大小,所得到的实验变差函数曲线总是接近于纯块金效应模型当采样网格过大时,将掩盖小尺度的结构,而将采样尺度内的变化均视为块金常数这种现象即为块金效应的尺度效应块金效应的尺度效应,34,行业重点,基台值(Sill):代表变量在空间上的总变异性大小即为变差函数在h大于变程时的值,为块金值c0和拱高cc之和 拱高为在取得有效数据的尺度上,可观测得到的变异性幅度大小当块金值等于0时,基台值即为拱高 C(0) C(h),35,行业重点,几何各向异性:变差函数在空间各个方向上的变程不同,但基台值不变(即变化程度相等)这种情况能用一个简单的几何坐标变换将各向异性结构变换为各向同性结构 带状各向异性:不同方向的变差函数具有不同的基台值,其中变程可以不同,也可以相同这种情况不能通过坐标的线性变换转化为各向同性,因而结构套合是比较复杂的地质变量相关性的各向异性,(2),36,行业重点,2. 变差函数的理论模型,设Z(x)为满足本征假设的区域化变量,则常见的理论变差函数有以下几类:,球状模型 指数模型 高斯模型 幂函数模型 空洞效应模型,37,行业重点,接近原点处,变差函 数呈线性形状,在变 程处达到基台值。
原点处变差函数的切 线在变程的2/3处与 基台值相交球状模型:,c为基台值,a为变程, h为滞后距38,行业重点,指数模型:,变差函数渐近地逼近 基台值 在实际变程处,变差 函数为0.95c 模型在原点处为直线39,行业重点,高斯模型:,变差函数渐近地逼近 基台值 在实际变程处,变差函 数为0.95c 模型在原点处为抛物线40,行业重点,幂函数模型:,,幂函数模型为一种无基台值的变差函数模型这是一种特殊的模型 当=1时,变差函数为一直线,即为线性模型,这一模型即为著名的布朗运动(随机行走过程)的变差函数模型; 当 1时,变差函数为抛物线形状,为分数布朗运动(fBm)的变差函数模型41,行业重点,空洞效应模型(Hole Effect):,变差函数并非单调增加, 而显示出一定周期性的 波动 模型可以有基台值,也 可以无基台值;可以有 块金值,也可以无块金 值 空洞效应在地质上多沿 垂向上出现,如富矿层 与贫矿层互层、砂岩与 泥岩频繁薄互层等等b为富矿化带重复距离),h,42,行业重点,通过区域化变量的空间观测值来构建相应的变差函数模型, 以表征该变量的主要结构特征求变差) (1)数据准备 区域化变量的选取、 数据质量检查及校正、 数据的变换(如对渗透率进行对数变换)、 数据的统计(如分相对储层参数计算平均值、 。
