
空间统计分析.ppt
85页地图分析与应用 Map Analysis and Applications李飞雪南京大学地理信息科学系2023323033032032303322033233033203023330232033230数据概括相同,空间模式不同3n数据分析的缺点以经典统计理论为基础标准正态分布缺失位置信息4n空间数据很少符合正态分布位置信息非常重要依赖(Dependence)是一种规律(rule)空间相互作用、空间外部性、空间溢出等空间尺度非常重要5•空间依赖性(Spatial Dependence)变量Y在第i个空间单元上的观测值由该空间系统中其他空间单元上的观测值通过函数f表达,i∈S,S是所有空间单元的集合 6•空间依赖性的产生原因空间相互作用测量误差 7•空间异质性(Spatial Heterogeneity)i代表空间观测单元,fi表示因变量yi与自变量xi、参数向量i和误差项i之间具体的函数关系 8(A)(B)(C)(D)(E)I =-1.000I =-0.393I =0.000I =+0.857I =+0.393空间模式的量化9专题三 空间统计分析n空间统计分析,即空间数据(spatial data)的统计分析,是现代计量地理学中一个快速发展的方向和领域。
n空间统计分析,其核心是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关,通过空间位置建立数据间的统计关系 空间统计分析n地球表面上的事物或现象之间存在着某种联系,并以相似或差异的方式表现出来nTobler(1970) “地理学第一定律”描述了这样性质:“所有的事物或现象在空间上都是有联系的,但相距近的事物或现象之间的联系一般较相距远的事物或现象间的联系要紧密”n在空间统计学中,相似事物或现象在空间上集聚(集中)的性质称之为空间自相关(Spatial autocorrelation)空间上的相关性或关联性(Spatial associatiaon)是自然界存在秩序与格局的原因之一(Goodchild 1986)地理学第一定律n在地理学中,每一个空间位置上的事物(现象)都具有区别于其他位置上的事物(现象)的特点,这种差异性被称为空间异质性(Spatial heterogeneity)(Anselin 1988)n与地理学第一定律所描述的空间依赖性相对应,Goodchild(2003)将空间异质性总结为“地理学第二定律”nGoodchild在2003年的UCGIS年会上做了一场题为“地理信息科学基本定律(The Fundamental Laws of GIScience)”的报告。
在该报告中,Goodchild将“空间异质性”概括为地理学第二定律(the Second Law of Geography)地理学第一定律13基本分析方法/分析指标n 空间权重矩阵p空间权重矩阵是对空间邻接关系的定义,是空间统计分析运算的基础之一n 全局空间自相关n 局部空间自相关1415n 空间权重矩阵(spatial weight matrix)p对空间邻居(spatial neighborhood)或邻接关系的描述,通常定义一个二元对称空间权重矩阵W,来表达n个位置的空间区域的邻近关系p目前对于空间权重指标的构建,主要基于两类特征:连通性(Continuity)和距离(Distance)此外,还可以通过面积、可达度等方式对空间权重指标进行构建空间权重矩阵16n 空间权重矩阵(spatial weight matrix)p基于连通性特征的空间权重指标,又可以称为空间邻接指标p三种基本的空间邻接定义方式:考虑横纵方向邻接关系的“卒”型、考虑对角线方向邻接关系的“象”型以及综合考虑上述方向的“后”型p空间邻接影响不仅仅局限于两个单元的相邻,一个空间单元还可通过相邻单元对外围非相邻单元产生影响,对于这类影响可以通过设定空间二阶乃至高阶邻接指标进行表达。
17n 空间权重矩阵(spatial weight matrix)p基于距离特征的空间权重指标,又可以称为空间距离指标p空间距离指标选择空间对象间的距离(如反距离、反距离平方值、距离负指数等)定义权重矩阵p如Cliff和Ord曾提出的Cliff-Ord空间权重指标,即是将距离作为指标定义的一部分i = 1,2,…,n;j = 1,2,…,n其中,dij为空间对象间的距离,βij为空间对象共享边界的长度,a、b为两类距离的权重调整系数18n 空间权重矩阵(spatial weight matrix)p空间数据集中不同实体单元间存在不同程度的空间关系,在实际使用中,一般通过矩阵形式给出空间逐点的空间权重指标,称为空间权重矩阵W是一个nn的正定矩阵,矩阵的每一行指定了一个空间单元的“邻居集合”一般地,面状观测值用连通性指标:若面状单元i和j相邻,则wij=1;否则,wij=0点状观测值用距离指标:若点i和j之间的距离在阈值d以内,则wij=1;否则,wij=0通常约定,一个空间单元与其自身不属于邻居关系,即矩阵中主对角线上元素值为019在实际应用中,一般根据以下两种规则定义邻居:p公共边界如果第i和第j个空间单元具有公共边界,则认为它们是邻居,空间权重矩阵中的元素为1;否则,不是邻居,元素为0。
p距离 如果第i和第j个空间单元之间的距离位于给定的临界距离d之内,则认为它们是邻居,空间权重矩阵中的元素为1;否则,不是邻居,元素为0Cliff-Ord广义空间权重矩阵 其中dij是i和j之间的距离,bij是i和j之间的公共边界占i周长的比例 2021空间自相关度量的意义 发现空间分布模式如何度量?全局空间自相关统计指数(a) 空间集聚(空间相似)(b) 空间间 隔(空间相异)(c) 空间随机22主要描述整个研究区域上空间对象之间的关联程度,以表明空间对象之间是否存在显著的空间分布模式Cliff and Ord, 1981)全局空间自相关分析主要采用全局空间自相关统计量(如Moran’s I、 Geary’s C、General G)进行度量 n全局空间自相关(global spatial autocorrelation)23Moran’s I 统计量是一种应用非常广泛的空间自相关统计量,它的具体形式如下(Cliff and Ord,1981):nMoran’s I其中,xi 表示第 i 个空间位置上的观测值, ,wij是空间权重矩阵W(n×n)的元素,表示了空间单元之间的拓扑关系,S0 是空间权重矩阵W的所有元素之和。
反映的是空间邻接或空间邻近的区域单元属性值的相似程度全局空间自相关统计指数24用矩阵形式表示如下:其中,X 是 xi 与其均值的离差向量(n×1),W 是(n×n)的空间权重矩阵,S0 含义同上25+4.55+5.54+2.24-5.15+9.02+3.10-4.39-2.09+0.46-3.06xyz 124.55135.54212.2422‑5.15239.02313.1 32‑4.3933‑2.09420.4643‑3.06Tabulated lattice dataAdjacency matrix, W I=0.0317. If this value is close to 0 there is very little spatial autocorrelation, which is what we have found in this example26对观测值在空间上不存在空间自相关(或独立、随机分布)这一原假设进行检验时,一般根据标准化以后的Moran’s I 值或 z 值,即: Moran’s I 的检验在统计推断的过程中,通常需要对变量x的分布做出假设。
一般分两种情况:一是假设变量 x 服从正态分布;二是在分布未知的情况下,用随机化方法得到 x 的近似分布通过在正态或随机两种分布假设下得到I的期望值和方差来分别进行假设检验27在正态分布假设下,Moran’s I 的期望值和方差分别为:式中和分别是空间权重矩阵 W 的第 i 行和第 i 列元素之和 28在随机分布假设下,Moran’s I 的期望值和方差分别表示为:式中其他符号同上29通常将Moran’s I 解释为一个相关系数,取值范围从-1到+10 0.95),则表明位置i 周围的观测值相对较低 53空间位置i 的局部Geary’s Ci统计量定义如下:其中,zi和zj是观测值的标准化形式,空间权重矩阵中的元素wij采用行标准化全局Geary’s C和局部Geary’s Ci统计量之间的关系是:p局部Geary’s Ci54局部Geary’s Ci统计量的伪显著水平p值的计算与局部Moran’s Ii统计量类似若p值较大(如p > 0.95),表明Ci值异常小,说明位置 i的观测值与周围邻居的观测值之间是正的空间联系(即相似);若p值较小(如p < 0.05),表明Ci值异常大,说明位置i 的观测值与周围邻居的观测值之间是负的空间联系(即不相似或差异大)。
55n空间关联特征的可视化在格网数据的可视化过程中,空间权重矩阵和空间滞后(spatial lag)是两个非常重要的概念(Anselin and Bao 1997,Anselin 1999)空间权重矩阵第i行的非0元素,定义了该空间单元的所有邻居将第i行所有邻居的观测值进行加权平均,即得到变量在位置i上的空间滞后若空间位置i上的观测值为yi,则相应的空间滞后是jwij∙yj通过采用饼状图、柱状图或散点图等形式,将每个位置上的观测值和其空间滞后之间的关系表示在地图上,以便进行直观的分析若用矩阵表示,则变量的空间滞后是空间权重矩阵(W)与观测值向量(y)的乘积(W∙y)56n柱状图 柱状图是专题地图中用来表示事物和现象内部结构组成的一种表示方法变量在某个位置上的观测值和其空间滞后之间的关联程度也可以用柱状图加以表示(Anselin,1994,Anselin and Bao,1997)57将每个位置上观测值(yi)和空间滞后((Wy)i)的大小用长方形表示,则构成柱状图若yi = (Wy)i,两个柱状图形的面积大小相等如果某一位置上的观测值较大,而空间滞后较小,两个图形的高度悬殊较大,表明该位置可能存在负的空间自相关。
如果该位置上的观测值和空间滞后的高度相差不大,表明该位置可能存在正的空间自相关柱状图一般仅适用于观测值为正的情况58饼状图一般仅适用于观测值为正的情况在饼状图中,将一个圆一切为二,划分为两个大小相等或不等的扇形其中,一个扇形表示该位置上观测值(yi)的比例大小,数值为yi/[yi+(Wy)i],另一个扇形表示该位置上观测值的空间滞后((Wy)i)所占的比例大小,数值为(Wy)i /[yi+(Wy)i]若yi = (Wy)i,两个扇形面积大小相等,均为整个圆的一半如果该位置上的观测值比重大,则空间滞后的比重将变小,两个扇形的面积大小悬殊较大,表明该位置可能存在负的空间自相关;如果该位置上的观测值和空间滞后的比例相差不大,表明该位置可能存在正的空间自相关59nMoran 散点图 散点图是数据分析中用来表示二个变量之间相关关系的一种常见的方法表示一个变量的空间自相关关系,可以采用Moran散点图(Moran scatterplot)Moran散点图可以用来探索空间关联的全局模式、识别空间异常和局部不平稳性等(Anselin,1994,1996)将变量在每个位置上的观测值表示在横轴上,其空间滞后(标准化的局部空间自相关指标Moran’s Ii )表示在纵轴上,则二者之间的相关关系就可以用坐标系中的散点形象地表现出来。
60由于变量观测值和其空间滞后之间的拟合程度(即直线的斜率)恰好是Moran’s I系数61Moran散点图分为四个象限,分别对应四种不同类型的局部空间关联模式:p右上象限。
