
变差函数的概念与计算分析.doc
6页变差函数的概念与计算谷跃民编写在地质统计学随机模拟工作中,统计归纳区域变量的分布和变差函数,是用好随机模拟技术最关键的两项工作,其中区域变量分布统计比较容易理解,变差函数计算过程相对复杂,影响了解释人员对它的直观理解,为了使解释生产人员快速了解变差函数,准确使用相关工具软件,并能依据现有的资料和对工区地质情况的先验信息,统计归纳出合乎实际的变差函数,作者在学习相关知识的基础上,对学习材料进行了初步总结,试图用通俗的方式,对变差函数的概念和统计归纳方法与大家共同进行探讨一、变差函数的基本概念在地质统计学中,变差函数是最基本与最重要的模拟工具,它用于描述数据值的空间互相关,数据点在空间上相距越远,相关性就变得越小,变差函数就是模拟这种现象的数学函数,通常用一张图来展示,用 X 轴表示滞后距离,用 Y 轴表示方差,可以从区域变量抽取的样本值中计算归纳出来,见图 1,它通过变程来反映变量的影响范围,V(h) 为变差函数值,Lag(h)为滞后距变差函数可以用四个参数来描述:1、变差函数类型:决定了随着滞 图 1 变差函数图示后距的增加变差(方差)变化的快慢,在 JASON STATMOD MC 中,使用 GAUSSIAN 和 EXPONENTIAL 曲线类型;2、变程 a:指的是在超过这个距离后,数据点之间就不再有明显的相关性,也称作影响距离;3、块金效应 C0: 表示在距离为 0 时的方差值,用来表示相距很近的两点的样品变化情况;4、先验方差:Sill=C+C 0 也叫基台值,它反映变量的变化幅度。
二、变差函数的估算与拟合1、变差函数的计算公式与估算变差函数的定义是:区域化变量 Z(x)和 Z(x+h)两点之差的方差之半,定义为 Z(x)的变差函数,数学定义如下:h 为滞后距如果有了区域化变量 Z(x)的一部分采样,就可以估算该区域化变量的 Z(x)变差函数,具体计算公式如下:i 为样本序号2、变差函数的估算示例为了能更直观、更深刻地体会它的具体意义,下面举两个计算实例,各具体计算两个变差函数值,通过具体计算过程,就会知道什么样的资料可以满足变差函数估算的要求,具体在资料条件会出现怎样的异常,这两个实例分别为两种区域变量类型,一个是垂向区域变量类型,可以理解为井曲线等,一个是平面区域变量类型,可以理解为孔隙度平面变化等1)垂向区域变量类型变差函数值计算示例右图为一口井的孔隙度曲线,纵向采样间隔为 1 米,右侧为其数值,首先根据公式 1-2,求取 h=1 米时,v(1)的数值,步骤如下:①将数据下移 1 米,与原始数据对齐;见图 3a;②找到对应数据对,求得各数据对的差值,分别为:0.75、-2.75……、1 等, 图 2 孔隙度曲线共 26 个数值;③求取以上个数值的平方,再求和,得0.752+(-2.75)2+……+12=27.625;④由于共有 26 个数据对,因此,N=26,所以,v(1)= 27.625/(2×26)=0.53125。
同理可以根据公式 1-2,求取 h=2 米时,v(2)的数值,步骤如下:①将数据下移 2 米,与原始数据对齐;见图 3b; a b②找到对应数据对,求得各数据对的差 图 3 v(1)和 v(2)数据对值,分别为:-2、-4 ……、1 等,共组成了 25 个数据对,因此共有 25 个数值;③求取以上个数值的平方,再求和,得(-2) 2+(-4)2+……+12=43.6875;④由于共有 25 个数据对,因此,N=25,所以,v(2)= 43.6875/(2×25)=0.873752)平面区域变量类型变差函数值计算示例右图 4 为一假设的平面地质属性数据,其南北和东西间距都为 1,假定这一地质属性具有各向异性特征,就应当计算它不同方向的变差函数值,那么,这时滞后距 图 4 平面地质属性数据h 是指向某方向移动的距离,计算时,在指定方向上,对指定的 h,搜索所有相距 h 的点对[Z(x i), [Z(xi+h)],并统计点对个数 N,其它步骤与前述垂向区域变量类型变差函数值计算步骤是相同的,以下是不同方向两个滞后距的计算结果。
东西方向移动 1 个单位距离,共组成 6 个数据对,因此,N=6,变差函数值为:东西方向移动 2 个单位距离,共组成 3 个数据对,因此,N=3,变差函数值为:北西北东北南北方向移动 1 个单位距离,共组成 6 个数据对,因此,N=6,变差函数值为:南北方向移动 2 个单位距离,共组成 3 个数据对,因此,N=3,变差函数值为:从北东向南西方向移动 个单位距离,共组成 4 个数据对,因此,N=4 ,变差函数值为:从北东向南西方向移动 2 个单位距离,共组成 1 个数据对,因此,N=1,变差函数值为:从北西向南东方向移动 个单位距离,共组成 4 个数据对,因此,N=4 ,变差函数值为:从北西向南东方向移动 2 个单位距离,共组成 1 个数据对,因此,N=1,变差函数值为:如果确信变差值与方向无关,也可以将这些计算结果,放到一张变差函数图上,来拟合确定一个变差函数3、变差函数的拟合在统计模拟中,变差函数采用的是一个解析函数,因此,计算出样本值的不同滞后距 h 的变差值 V(h)后,还必须拟合出一个解析函数,变差函数的拟合有很多种方法,比如,在指定出函数类型后,可以使用加权最小二乘法、线性规划法、遗传算法等确定出函数的常数项,得到 图 5 几种常用变差函数类型变差函数的解析式;由于实际样本中,数量可能有限,或许分布代表性较差,常常采用交互式拟合方法,交互拟合既可以选择出更适合本区实际的函数类型,又可以添加上本人对本区地质规律的先验知识,解决由于样本值少参数不好确定的普遍问题。
选用哪种函数拟合,一方面取决于样本数据,另一方面,也取决于对实际规律的掌握程度,常用的函数有三种,分别是球状模型、高斯模型和指数模型,它们的具体特点如图 5 所示:球状模型的标准化形式是:变程 a 球型 =a,由曲线可以看出,近距离相关性变化很快,接近变程时相关性变化小高斯模型的标准化形式是:变程 a 高斯 = ,由曲线可以看出,在变程中部距离相关性变化很快,接近变程时和近距离相关性变化慢指数模型的标准化形式是:变程 a 指数 =3 a ,由曲线可以看出,在近距离相关性变化很快,远距离相关性变化慢了解了这些特点,就可以根据实际选取更合适的拟合函数类型了在实际应用中,为了更好地与样本值计算的变差值拟合和更符合实际情况,还常用这几种函数与 Nugget(一个等概率随机型函数)线性组合Nugget 这个随机函数就是块金常数 c0,它的大小可反映区域化变量随机性的大小,随机 图 6 等概率随机型函数性大这个数值就大变差函数的变程大小,不仅能反映某个区域变量在某一方向上变化的大小,同时还能从总体上反映出区域变量的载体(如砂岩) 在某个方向的平均尺度,从而可利用变程来预测砂体的某个方向的延仲尺度,以实现预测砂体 图 7 变程的意义图示规模为目的。
变差值的具体意义还可以做如下理解,以一个孔隙度区域变量为实例,将区域变量孔隙度样本值错开 h 距离后,选取重合的点,做出右图所示交会图,可以最佳拟合出一条直线,见图,求取每一个点与这条直线的距离 di,再求取这些距离的平方和,用总点数取平均,就是滞后距 h 时的变差值 图 8 变差函数值的意义因此,v(h)值越大,表明这张交会图的点子越分散,相反,v(h)值越小,这些散带点在这条直线两侧就越集中;也可以如下理解,Porosity(x)与 Porosity(x+h)相关性越好,v(h) 值越小,关性越差,v(h) 值越大。
