资料质量控制和分析方法.doc
8页第二章 资料、质量控制和分析方法2.1 研究区域和资料本文研究范围为石家庄市所辖全部区县 区域边界及其所用的 17 个气象观测站点位置分布见图 2.1 区域经度范围为 114.13 °~ 115.21 °,纬度范围为 37.59 °~ 38.45 °,海拔高度在 35.9m~255.5m 之间各气象站基本信息见表 1表 1 应增加观测记录年份和迁站时间等信息 )图 2.1 石家庄地区 17 个气象站点分布表 1石家庄地区 17 个观测站基本信息站点经度纬度海拔高度 (m)石家庄市区114.42° 38.03 °81新乐114.68° 38.35 °70.8辛集115.21° 37.91 °35.9赞皇114.36°37.65 °137.4平山114.2 °38.25 °131井陉114.13° 38.03 °255.5正定114.56° 38.15 °71行唐114.55° 38.45 °96.2灵寿114.38°38.3 °108.9藁城114.81° 38.01 °53.5晋州115.06° 38.01 °42.4无极114.96°38.2 °45.4深泽115.18° 38.18 °38.1栾城114.63 ° 37.88 °52.9赵县114.73 ° 37.76 °38.5元氏114.53 °37.75 °66.4高邑114.61 °37.59 °48.9本文后面气温和降水两章所用资料为石家庄市气象局业务科提供的石家庄地区17 个观测站的逐日平均气温、最低、最高气温和降水资料。
由于各站资料的时间序列长度不同,为了对比分析,因此在温度、降水变化特征中统一采用 1972-2008 年 37 年的资料周期分析中所用资料为石家庄市区站建站以来即 1955 年至 2008 年的逐日平均气温、降水资料城市气候一章城市化对气温和降水量的影响分析所用资料为石家庄市区站和 16 个郊区站 1972-2008 年逐日平均气温和降水资料其中 5.1 和 5.2 小节所用资料为石家庄市区站以及藁城、元氏、平山和新乐四个距离市区站较近的郊区站 1962~ 2009 年近 48 年的逐日平均气温、最低气温和最高气温四个郊区站分布在市区站东、南、西、北四个方向,海拔高度与市区站接近,因此不必做高度订正,减少了分析误差;且探测环境受城市化影响较小分析日变化时采用 2009 年 3 月至 2010 年 2 月加密的逐时气温资料所用资料均由石家庄气象局相关业务单位进行了初步的质量控制,订正了由于各种人为因素造成的错误值2.2 资料均一化订正本文借鉴李庆祥等 [65] 检验和订正国家基本、基准站气温数据时所采用的E-P 方法,对所用气温资料进行了均一性检验和订正周雅清等[32]也曾采用这种方法检验和订正华北地区的气温资料。
降水资料的时间序列对于台站位置变动等影响没有温度那么敏感,所以本文对降水资料没有进行严格的均一性检验和订正首先对所有台站建立气温变化序列dT/d t ,计算待检台站 dT/d t 序列和它附近台站的Tt 序列的相关系数,选取5 个与之正相关最大的台站作为参考台站利用参考台站序列d /d和待检序列相关系数的平方作为权重建立参考Tt序列,再反算得到参考序列然后采用d /d滑动 t 检验法检测待检序列和参考序列的差异序列的不连续点,并通过台站历史沿革资料确定其合理性如果不连续点附近存在站址迁移,则认为该不连续点是合理的,并进一步进行订正;否则保留原始记录对于那些被确认的有合理不连续点的待检序列,计算其与参考序列的差异序列在不连续点前后 5 年的差值,以此作为补偿值来订正不连续点为了与以后的资料合并使用,订正是以最近的资料为基础从后向前进行的由于上述方法要求序列子段必须多于 5 年,因此,如果不连续点是在开始年后或结束年前的 5 年内,检验的结果也只能出现在开始后或结束前的第 5 年这就需要参考台站的沿革资料进行鉴别,确定其真实不连续点的位置和补偿值通过订正,使得包括台站迁移、仪器更换、观测方法改变等对资料均一性的影响尽可能减少到最小。
在对各站年平均气温进行均一性检验过程中(图 2.2 ),发现 17 个站均在 1993 年出现断点,排除了迁站和仪器更换的原因,因此各站的年平均气温在 1993 年是一次正常的突变各站年平均最低气温(图略)与年平均气温类似,断点出现在 1987 年和 1993 年,同样排除了迁站和仪器更换的原因各站年平均最高气温则比较均一,没有出现一致的断点现象图2.2石家庄地区各站年平均气温均一性检验(黑实线为 a =0.05 的显著性水平)通过对各站年平均气温、年平均最高、最低气温进行检验,发现有 1 个站( 5.9%)的平均气温资料存在非均一性引起的偏差,有 1 个站( 5.9%)的平均最高气温资料存在非均一性引起的偏差,有 3 个站( 17.6%)的平均最低气温资料存在非均一性引起的偏差,检验表明石家庄地区近四十年气温资料中的非均一性现象并不严重,资料质量较好这些偏差主要是由台站迁移造成的,订正后主要由于台站迁移引起的温度资料非均一性问题获得了比较好的解决2.3 分析方法 [66](1. 不能把文献引用序号放标题上,要在后边具体位置引用; 2下文公式应简化,所保留公式要有出处,要统一编号 )(1)滑动平均滑动平均是用确定时间序列的平滑值来显示要素的低频变化特点,经过滑动平均后,序列中短于滑动长度的波动或周期大大削弱。
对样本容量为 n 的序列 x,其滑动平均序列表示为:x j1kxi j 1j=1,2,,n-k+1k i 1式中 k 为滑动长度,本文 k 值取 52)距平一组数据的某一个数 xi 与均值 x 之间的差就是距平 x ' ,即 x ' xix ,气候变量的一组数据 x1, x2,... xn 与其均值的差异就构成了距平序列xx, x2x,...xnx2.11在气候诊断分析中,常用距平序列 2.1 来代替气候变量本身的观测数据任何气候变量序列,经过距平化处理,都可以化为平均值为 0 的序列这样处理可以给分析带来很多便利,计算结果也更直观3)线性趋势用 xi 表示样本量为 n 的某一气候变量,用 ti 表示 xi 所对应的时间,建立 xi 与 ti 之间的一元线性回归:xa bti, i=1,2, , n2.2?i方程( 2.2 )可以看作一种特殊的、最简单的线性回归形式它的含义是用一条合理的直线表示 x 与其时间 t 之间的关系上式中 a 为回归常数, b 为回归系数 ( 即倾向值 ) a 和 b 可以用最小二乘法进行估汁n1nnxi ti(xi )(ti )bi 1ni1i1,n1 (nti2ti )2i 1ni1axbt ,1n, t1n其中 xxin itin i 11利用回归系数 b 与相关系数之间的关系,求出时间ti 与变量 xi 之间的相关系数:rnti21 (nti ) 2i 1ni1n21nxi )2xi(i 1ni1回归系数 b 的符号表示气候变量的趋势倾向。
b >0时,说明随时间 t 的增加 x 呈上升趋势;b <0时,说明随时间 t 的增加 x 呈下降趋势 b 值的大小反映了上升或下降的速率,即表示上升或下降的倾向程度相关系数 r 表示 x 与时间 t 之间线性相关的密切程度要判断变化趋势的程度是否显著,就要对相关系数进行显著性检验确定显著性水平 a ,若 r > r a ,表明 x 随 t 的变化趋势是显著的,否则表明变化趋势是不显著的本文选取 a =0.05 , a =0.01 和 a =0.001 三个显著性水平进行检验, a 值越小, r a 值越大,表明变化趋势越显著 4)滑动 t 检验滑动 t 检验是通过考察两组样本平均值的差异是否显著来检验突变 其基本思想是把一气候序列中两段子序列均值有无显著差异的问题来检验如果两段子序列的均值差异超过了一定的显著性水平,可以认为均值发生了质变,有突变发生对于具有 n 个样本量的时间序列 x ,人为设置某一时刻为基准点,基准点前后两段子序列 x1 和 x2 的样本分别为 n1 和 n2 ,两段子序列平均值分别为x1 和 x2 ,方差分别为 s12 和 s22 定义统计量:x1x22.3ts 11n1n2其中n1s12 n2s22sn1 n2 2方程 2.3 遵从自由度 v n1 n2 2 的 t 分布。
给定显著性水平 a ,查 t 分布表得到临界值 ta ,若 ti < ta ,则认为基准点前后的两字序列均值无显著差异,否则认为基准点时刻出现了突变本文给定显著性水平 a =0.05 5)皮尔逊相关系数皮尔逊相关系数是描述两个随机变量线形相关的统计量,一般简称为相关系数或点相关系数,用 r 来表示设有两个变量。





