
GIS中的数据分析.docx
10页二GIS中的数据分析第 1 节 空间数据分析地理信息系统(GIS)与一般的计算机辅助制图(CAM / CAD)系统 的主要区别在于GIS具有空间数据的分析、变换能力除一些基本的 变换功能如数据更新、比例尺变换,投影变换外.主要的空间分析和 变换功能为地理数据的拓扑和空间状况运算,属性综合运算,几何要 素与属性的联合运算等为了完成这些运算,GIS 一般都以用户和系 统交互的形式提供以上分析处理能力应指出,栅格数据结构与矢量 数据结构的空间分析方法有所不同一般来说,栅格结构组织数据的 空间分析方法要简单一些下图以分级结构形式概括的各种空间分析类型和方法:厂数据变换 ——栅裕矢咼比按囹邢分析——庫曲.披莊变换、比桝尺变换匚便空I可2卜析-■ 二维亀示-轉性分析-一邃輯/数学运算——重分类]卑变量分级分析1梦变量统汁忖析「—地形殊析一厂空问内捕忻析 卜址度、玻向处析 卜朋用剖面专析 卜三樂捷形显示 ]戒墳Q令水城归析弊像分朽亠厂能強毎析类分析(数字图傲•垦理內客) 卜字元信息叠合分护1-滤波分析--折卄与購性联令分析厂网帝分靳,一数吾检索厂比化番轻分析—时问和吊离计算—网取趣的橈拟分析一發种直分析「叠憧分折一厂蝕含并析 卜多边序叠賈 匚俯格数据雅蛊-幵窗分析图:GIS空间分析方法一、综合属性数据分析GIS中属性数据一般采用关系型数据库管理,因此,关系数据库 中各种分析功能都可以对属性性数据进行分析。
一) 数学计算属性数据中的数字型数据可以进行“加”、“减”、“乘”、“除”、 “乘方”等数学运算,以产生新的属性值,如人口数/图斑面积km) =人口密度二) 逻辑运算逻辑运算的基本原理是布尔代数,这种逻辑分析几乎可以在所有 的空间分析中得到应用它按属性数据的组合条件来检索其他属性项 目或图形数据,以及进行空间聚类.(三)单变量分级分析属性的单变量分级分析是把单个属性作为变量,依据布尔逻辑方 法分成若干个类别这种分析方法,可进行属性数据的合并式转换, 把复杂的属性类别合并成简单的类别,以实现空间聚合(四)多变量统计分析多变量统计分析主要用于数据分类在GIS中存储的数据具有原 始的性质,以便用户可以根据不同的使用目的,进行任意提取和分析, 特别是对于观测和取样数据.随着采用的分类和内插方法的不同,得 到的结果有很大的差异, 因此,在大多数情况下, 首先是将大量未经 分类的属性数据输入信息系统的数据库,然后要求用户建立具体的分 类算法,以获得所需要的信息1.变量筛选分析随着现代数据收集系统的不断改进,在一个取样点上常可以收集 到几十种原始变量在这些变量中有许多是相互关联的,可以通过寻 找一组相互独立的变量,使多变量数据得到简化,这就是变量筛选分 析。
常用的变量筛选方法有主成分分析法、主因子分析法和关键变量 分析法等主成分分析是以取样点作为坐标轴,以属性变量作为矢量矩阵, 研究属性变量之间的亲疏关系主因子分析是以属性变量作为坐标轴,以取样点作为矢量矩阵 ,通过以相似系数建立相关矩阵来研究取样点之间的亲疏关系关键变量分析则是利用同性变量之间的相关矩阵,通过由用户确定的阀值,从数据库变量全集合中选择 一定数量的关键独立变量,以消除其它 冗余的变量2.变量聚类分析所谓变量聚类分析就是一系列数据 观测点的属性交量,按其性质上的亲疏 远近程度进行分类二、缓冲区分析彳同类型宜旅缓冲K的越之』一-点蠅沖氐 虹滋堆帥【或 匸…画绸冲区缓冲区(BUFFER)分析即根据数据库中的点、线、面实体,在其周 围建立一定宽度范围的缓冲区多边形(如下图)这是GIS空间分析的 基本功能之一例如,断层影响带.特征要求缓冲区宽度不同时的处理:在进行缓冲区分析时,经常 发生不同级别的同一类要素具有不同的缓冲区大小例如,在城市土 地地价评估时,沿主要街道两侧的通达度、繁华度的辐射范围大.而小街道则较小.这与要素的类型和特点有关在建立这种缓冲区时, 首先应建立要素属性表,根据不同属性确定不同的缓冲区宽度,然后 再产生缓冲区.三、空间合成叠置分析空间信息(多边形网络叠置层)的合成叠置,就是把同一地区、同 一比例尺的两幅或两幅以上的图层重叠在一起,产生新的空间图形或 空间位置上新的属性(加、减、判别等)。
叠置后产生的新的图形属性 就是原叠置相应位置处的图形对应属性的函数,可用下述关系式表 达:U=f (A、B、C...)式中A、B、C...表示原叠置层的图形的属性.f函数取决于各层上的 属性与用户需要之间的关系一) 包含分析包含分析主要用于确定点、线、面之间的相互联系,如确定某区域内矿井的个数,这是点与面之间的包含分析ninq;UJLd4愷母**]t2ffl古J4icE:ciS4A74n觀包含幷斩(二)多边形叠置参加叠置分析的两个图层应都是矢量多边 形结构若需进行多层叠置,也是两两叠置后 再与第三层叠置,依次类推其中被叠置的多 边形为本底多边形,用来叠置的多边形为上覆 多边形,叠置后产生具有多重属性的新多边形(右图)多边形叠置的目的是通过区域多重属性的模拟,寻找和确定同时 具有几种地理属性的分布区域;或是按照确定的地理指标,对叠置后 产生的具有不同属性级的多边形进行重新分类或分级三)栅格数据的叠置分析栅格数据的叠置,有三种主要变换类型的函数关系,即点变换、 区域变换和邻域变换四、网络分析网络是一系列相互联结的弧段.形成物质、信息流通的通道例如;水从水库流向各种水渠;从发电厂经电网向用户供电;城市的道路网 均构成网络.网络分析的主要用途是:选择最佳路径;选择最佳布局中心的位 置。
所谓最佳路径是指从始点到终点的最短距离或花费最少的路线; 最佳布局中心位置是指各中心所覆盖范围内任一点到中心的距离最 近或花费最小;网流量是指网络上从起点到终点的某个函数,如运输 价格,运输时间等网络上任意点都可以是起点或终点第2节 数字地面模型(DTM)与地形分析一、DTM的概念与作用数字地面模型是描述地面诸特性空间分布的有序数值阵列.二、DTM的表示方法1.数学分块曲面表示法这种方法把地面分成若干个块,每块用一种数学函数,如博立叶 级数多次多项式、随机布朗运动函数等,以连续的三维函数高平滑度 地表示复杂曲面,并使函数曲面通过离散采样点2.规则格网表示法规则格网表示方法是把DTM表示成高程矩阵,它来源于直接规 则矩形格网采样点或由规则或不规则离散数据点内插产生由于计算 机对矩阵的处理比较方便.特别是以栅格为基础的 GIS 系统中高程矩 阵已成为DTM最通用的形式3.不规则三角网(TIN)表示法不规则三角网(TIN)是专为产生DTM数据而设计的一种采样表示 系统它克服了高程矩阵中冗余数据的问题,而且能更加有效地用于 各类以DTM为基础的计算因为了 DTM可根据地形的复杂程度来 确定采样点的密度和位置,能充分表示地形特征点和线,从而减少了 地形较平坦地区的数据冗余。
TIN表示法利用所有采样点取得的离散 数据,按照优化组合的原则,把这些离散点(各三角形的顶点)连接成 相互连续的三角面(在连接时,尽可能地确保每个三角形都是锐角三 角形或是三边的长度近似相等),如下图三、DTM的空间内插方法DTM空间内插的概念十分简单,即在一个由x、y坐标平面构成的 二维空间中,由已知若干离散点的高程,估算待内插点的高程值由 于DTM采样的数据点呈离散分布形式,或是数据点虽按格网排列, 但格网的密度不能满足使用的要求,这就需要以数据点为基础进行插 值运算DTM内插按插点分布范围,可分为分块内插、剖分内插和单点移 面内插三类,见下图F立叶级数内舞-叢択塞项式;内播—孔斯曲面内橢—片样条曲面内描 !-叽塞尔曲面内插—二兀样条密数内捞I-仆块内楠———特殊曲面内搞 「多层叠加插值面函数內摘DTM吟同内摘-量小二柬出置法內抽L有限兀法〔址权幕捽法)內播密顼式内辎爹坝式忍合内插—Kri^inp内插箧DTM空间内插方法分类常用的内插方法有:1. 二元多项式拟合内插(趋势面拟合)2. 二元样条函数内插3. 距离加权平均内插4. KRIGGING 算法四、DTM地形分析尽管 DTM 的应用十分广泛,但地形分析是其基本应用,其它应 用都可由此推演、扩展。
地形分析的内容有地形因子提取、地表类型分类以及剖面团的绘制 等一)地形因子的自动提取1. 坡度和坡向分析:坡度定义为水平面和地形表面之间夹角 的正切值;坡向为坡面法线在水平面上的投影与正北方向的夹 角坡度和坡向的计算通常在3X3个DTM格网窗口中进行2. 地表粗糙度计算:地表粗糙度是反映地表的起伏变化和侵 蚀程度的指标,一般定义为地表单元的曲面面积与其在水平面 上的投影面积之比但根据这种定义,对光滑而倾角不同的斜 面所求出的粗糙度,显然不妥当实际应用中,以格网顶点空 间对角线L1和L2的中点距离来表示地表粗糙度,值愈大,说 明4 个顶点的起伏变化也愈大3. 高程变异分析:高程变异是反映地表单元格网各顶点高程变化的指标,它以格网单元顶点的标准差与平均高程的比值来 表示4. 谷脊特征分析: 谷和脊是地表形态结构中的重要部分谷是地势相对最低点的集合,脊是地势相对最高点的集合二)地形剖面图的绘制DTM 表示了—个区域地形的整体状况在应用中经常需要了 解从地面上一点至另一点沿途的地形变化情况,如通视性、地貌轮廓 形状、斜坡特征、地表切割强度等,这就需要绘制地形剖面图三)真实感地形表示把地形表面以真实感强的三维图形表示出来。
若把地形表示成 色调连续变化的三维图像,则在土地景观设计、森林覆益模拟等应用 中更适用、美观和形象其处理过程是:透视变换;色调计算,隐藏面消除;图形输出等(四)泰森多边形分析第三节 数据输出与自动制图(略)。












