哈尔滨理工大学 舒印、贾云铜、李相敏
摘 要
本文利用长江中下游地区各观测站1960-2010年逐日降水量、日平均气温计算各站逐日的旱涝指数,并设定干旱、洪涝灾害的标准,通过数据处理得到三峡工程建设前(1960-1994年)和一期建设完成后(1998-2010年)各观测站旱涝指数超过标准值的天数,根据统计学原理,该天数变量服从二项分布,因此将研究问题三峡工程是否对长江中下游地区旱涝灾害有影响转化为二项分布参数的检验问题,即比较三峡工程建设前后各地区旱涝指数超过标准值发生的概率是否有显著差异。
对于二项分布参数的检验问题,有很多种方法:渐近正态的方法、Bayes方法、Fiducial方法等,其中Fiducial方法是在20世纪30年代由Fisher首先提出的,目前已被广泛应用。但因其Fiducial分布的不唯一性,使得它的发展受到了一定的限制,如何选定良好的Fiducial分布,也是一个备受关注的问题。文献[20]对于二项式分布的参数给出了一个较好的近似Fiducial分布。本文据此渐近Fiducial分布,利用计算机模拟出参数函数的渐近Fiducial分布的分位点,按照Fiducial方法的原理推导出二项分布参数的检验问题的拒绝域。进一步将其应用于“三峡工程的建设是否导致了长江中下游地区旱涝灾害的加重”这一课题的研究分析,最后本文对此做出了科学的评价。
关键词:Fiducial方法;旱涝指数;三峡工程;二项分布
1
目 录
摘 要............................................................................................................................ 1 一 、引言...................................................................................................................... 3
1.1 研究背景................................................................................................. 3 1.2 研究目的................................................................................................. 3
二 、文献综述、数据来源与处理.............................................................................. 4
2.1 文献综述................................................................................................. 4 2.2 数据来源与预处理................................................................................. 5
三 、旱涝指数.............................................................................................................. 5
3.1 Z指数..................................................................................................... 5 3.2 Z值的分析............................................................................................. 7
3.3 旱涝程度的标准值................................................................................. 9
四 、统计模型............................................................................................................ 12
4.1 参数的Fiducial分布 ........................................................................... 12
4.2 参数的Fiducial检验 ........................................................................... 14
五 、三峡工程对旱涝灾害影响的分析.................................................................... 16
5.1 检验结果............................................................................................... 16
5.2 结果分析............................................................................................... 17
六 、结论及评价........................................................................................................ 17 参考文献...................................................................................................................... 18
2
一、 引言
1.1 研究背景
三峡工程是世界上规模最大的水电工程,也是中国有史以来建设的最大型工程项目。其水电站位于重庆市市区到湖北省宜昌市之间的长江干流上,大坝位于宜昌市上游不远处的三斗坪,俯瞰三峡水电站并和下游的葛洲坝水电站构成阶梯级电站。
建造三峡大坝的设想最早可追溯至孙中山先生,他在《建国方略》一书中认为长江“自宜昌以上,入峡行”的这一段“当以水闸堰其水,使舟得溯流以行,而又可资其水利”。而后1953年,毛泽东视察三峡时,表示建设三峡工程的设想,并指定周恩来督办。在周恩来的主持下,开始了三峡工程的勘探、设计、论证工作,并邀请了苏联水利专家参与。1992年建设三峡工程的议案获得通过,标志着三峡工程进入建设期。三峡工程分为三期,总工期17年。第一期工程5年(1992-1997年),已于1997年11月8日大江截流而宣告完成;第一阶段建设目标完成后,长江水位从原来66米提高到88米。第二期工程6年(1998-2003年),2003年4月27日,三峡工程二期移民工程通过国家验收,达到三峡工程按期蓄水的要求;6月,水位提升到135米,回水至长江万州境内。第三期工程6年(2003-2009年),2006年水位提高到156米。2009年大坝竣工,再经过三年时间,即到2012年,最终坝上水位海拔高度将达175米,水位实际提升110米,回水将上溯到重庆境内。三峡工程动态总投资预计为2039亿元人民币,水库最终将淹没耕地43.13万亩,最终移民113.18万人。工程竣工后,防洪库容221.15亿立方米,总库容达393亿立方米,在防洪、抗旱、航运、发电等方面产生重大的意义。正因为三峡工程如此浩大,从筹建的那一刻起,各种争议就未曾间断过。
早期的不同意见多偏重于经济和技术因素,普遍认为经济上无法支撑,技术上也难以实现预定目标,并且移民难度极大。1953年,建设提议一经提出,就遭到了水利专家黄万里、李锐等人的激烈反对。到了1980年代以后,国内关于三峡工程的争论更加广泛,涵盖了经济、政治、移民、环境、文物、旅游等各方面。由于三峡库区属亚热带季风气候,具有冬暖春早,夏热伏旱,秋多雨,湿度大等特征,库区内植被类型多样,同时生态环境比较脆弱,库区水土流失严重,干旱、暴雨、滑坡、泥石流等自然灾害频繁,对于三峡工程是否影响周边的气候一直存在着争论。
1.2 研究目的
近年来,川渝大旱,西南大旱以及2007年重庆百年一遇的暴雨使人们对三
3
峡的关注越来越密切。尤其是今年长江中下游地区先是持续少雨,平均降水量为1951年以来历史同期最少,部分地区出现严重旱情,而后又持续降雨,使部分地区遭受严重旱涝灾害,再次将三峡推向舆论的顶峰。本文利用长江中下游地区20个气象站1960-2010年每天的平均气温和降水数据,应用统计学方法研究三峡大坝对长江中下游的旱涝情况到底有无影响。
二 、文献综述、数据来源与处理
2.1 文献综述
三峡坝区位于长江三峡西陵峡中段,该地区受季风和地形影响, 导致降水量年际变化较大,各种灾害频繁。近年来秋雨、风暴、冬暖现象明显,需要做更深层次的研究。以往,我国的气候评价主要以单个气象站的观测数据和定性描述为主,定量分析也只依据单一要素,具有一定的局限性,多要素的综合分析、评价和区域气候特征的定量表达还不多见[1]。三峡坝区对周边环境具有一定的影响,为此对长江中下游多个地区多个站点进行综合分析评价是非常有研究意义的。
长江中下游地区由长江及其支流冲积而成,位于长江三峡以东,绝大部分的高度都在海拔50米以下,独特的地理位置使得该地区气象灾害种类多,发生频繁。许多学者已对洪涝、干旱、高温、暴雨、连阴雨等灾害发生的成因、频率、特征分析、程度进行了研究(李强等,2010[2];张强等,2007[3];张天宇等,2010[4];郑蓉,2002[5];赵玉春和周月华,2002[6]),这些成果对于研究局地性的气候灾害具有重要的科学意义。
降水Z指数是国家和省级旱涝监测业务的主要指标,它能够较客观地反映出干旱程度。Z指数方法由于消除了量纲,将降水资料正态化处理,抵消了降水量平均值不同的影响,相比于其他方法,是划分旱涝较好的指数,更适合在实际中使用。黄道友等(2003)应用Z指数法进行判断南方季节性干旱的结果分析[7];魏凤英(2004)利用Z指数指出干旱标准不仅与降水量有关还与蒸发量有关,定义了华北干旱强度指标并对指标进行了分析[8];夏伟等,利用降水量数据,采用
Z指数的修正方法对数据进行处理计算,并与河北省Z指标旱涝等级比较得出河
北省近20年旱涝灾害发生规律[9];高建芸等(2006)采用快速傅里叶变换(Fast Fourier Transform,FFT)、经验正交函数(Empirical Orthogonal Function,EOF)、正交小波变换(Orthogonal Wavelet Transform,OWT)、连续小波变换(Continuous Wavelet
Transform,CWT),分析了福建省不同雨季旱涝Z指数序列
;朱业玉等(2006)通过对降水Z指数方法进行分析,得出Z指数的修改和订正方法,并对区域旱涝指标进行了讨论[11];史印山等(2008)利用单站旱涝Z指数变换和区域旱涝指数分析了华北夏季降水异常的大气环流特征,并对华北区域旱涝时空分布特征进行了分析[12];方茸等(2010)根据旱涝的实际分布对Z指数进行了修改和订正,研究了我国安徽江淮分水岭地区的旱涝情况[13];蔡敏等(2010)研究了Z指数方法的小流域洪涝灾害预警技术,并指出采用任意连续10天法计算的洪涝Z指数更科学,更能反映实际情况[14];李景刚等(2010)通过区域综合Z指数的构
4
[10]
建对洞庭湖流域近10年旱涝特征进行了分析,并验证了TRMM数据在流域旱涝检测中具有很好的可行性和较高的可信度[15]。
Fiducial 推断方法不需要先验分布,它只根据数据给出参数的分布。Fiducial 推断由Fisher提出,其后不少统计学者对之进行研究。李新民[16]给出了限制参数空间上求参数Fiducial区间的一般方法,将其应用于一些模型;徐兴忠和李国英[16][17]在枢轴分布中给出了构造参数Fiducial分布的一般方法,李新民等[19]利用Fiducial推断求广义P值的一般方法并讨论了其频率性质。熊世峰和牟唯嫣[20]利用调整的logit变换后估计量的渐进正态性对二项分布建立了近似的枢轴方程,并由此得到了二项分布参数的一种近似信仰分布。
2.2 数据来源与预处理
本文所用数据全部来源于中国气象数据共享服务网 。本文初始搜集了长江中下游地区湖南、湖北、浙江、安徽、上海等地的24个气象站所记录1951-2010年的日平均气温和降水量。在处理数据时发现部分气象站所记录的数据并不完整,如湖南长沙气象站缺失1987-2006的数据;发现宜昌所记载的数据仅到2010年6月2号,由于宜昌地理位置特殊,是本文研究的重点区域,不宜将其气象站舍去,最终选取了20个气象站1960.01.01-2010.06.02的数据,包括安徽省的安庆、蚌埠、毫州、合肥、霍山,湖北的恩施、老河口、武汉、宜昌,湖南的常德、零陵、芷江,江苏的东台、赣榆、南京、徐州,浙江的定海、杭州、衢州、 酉阳,其地理位置如图1:
图1 各站地理位置
三 、旱涝指数
3.1
Z指数
由于Z指数能够较客观地反映出干旱程度,故本文利用搜集的20个气象站1960-2010年每日的温度和降水量数据,应用Z指数表示长江中下游地区每日的旱涝指数。由于影响旱涝指数的因素很多,而且较为复杂,蒸发量的数据不易得到,故采用高桥浩一郎公式计算蒸发量。高桥浩一郎的陆面蒸发经验公式为
5
E310P31000.018Pexp(23.44T2350.1T (1)
)其中,E、P、T分别为日地面蒸发量,日降水量和日平均气温,单位分别为0.1mm、0.1mm和0.1℃。
降水量和蒸发量之差用F表示,用来衡量水分的余缺情况,计算公式为
FPE (2) 利用(1)、(2)两式以及搜集的数据可以计算1960年1月1号至2010年6月2号的每一天的F值。在研究F值时发现某一段的F值一般并不服从正态分布,为此用personⅢ分布拟合某一时段的F值效果较好,Z指数正是假设某时段的F值服从personⅢ分布,得到其概率密度函数。而后对F值进行正态化处理,将概率密度函数personⅢ型分布转化为以Z为变量的标准正态分布。该Z值即为衡量旱涝程度的指标,Z值越大,表示洪涝程度越大;Z值越小,表示干旱程度越大。将重灾定义为20年一遇,中等灾害为10年一遇。前面的研究中认为Z为标准正态变量。则 Z值计算公式为
Zi6Cs(Cs21i1)36CsCs6
其中,Zi为各站的Z指数值,Cs为偏态系数,i为标准变量。Cs和i的计算公式为
n(FCsi1iF)33n
iFiF
其中,F为某一天各站F平均值,n为总站数,为标准差;F和的计算公式为
F1niF ni11ni(Fni1F)
26
利用上述计算方法将搜集到的数据代入,可求得各站每一天的Z指数值。在计算Z值的过程中,发现由于少部分天数各个站的降水量都为0,无法计算其Z值,故用插值的方法得到这些天的Z值。
3.2
Z值的分析
对各站的Z值做散点图,发现散点分布情况大体一致,由于宜昌站地理位置重要,定海站地理位置特殊,现以宜昌站和定海站为例,给出散点图,如图2和图3:
图2 宜昌站各天Z值的散点图
7
图3 定海站各天Z值的散点图
由图2、3可以看出,大致在1980年以前,分布在上下两端的点较多,而1980年以后,点的分布较为集中,中间的点较多。可以认为1985年以后,长江中下游地区遭受的自然灾害比1985年前较为少。1985年以后,点的分布稳定,没有太大波动,即从三峡工程建设前和建设后自然灾害发生的频数稳定。
根据各站每天的Z值计算每年Z的均值,以安庆、南京、武汉、宜昌、定海五个气象站为例,其余站的Z值变化曲线类似,作出图3:
8
图4 五个站每年Z均值变化曲线
由图4可以看出,每年Z均值有增大的趋势,即每年平均降水量有增多趋势。各年Z均值均大于0,表示长江中下游地区属于多雨气候。
3.3 旱涝程度的标准值
对各站每天的Z值排序,得到Z值曲线,如图5:
图5 各站排序后的Z值曲线
由图5可知,各站Z值的分布大致以0为对称轴,但Z值较大的数偏多,即
9
降水较多的天数多,这与长江中下游地区的气候特征一致,说明各站Z值的实际分布与标准正态分布有一定的误差,把Z当成标准正态分布并不符合实际,因此按标准正态分布来确定旱涝程度的标准值与实际偏差较大。故本文根据实际情况重新选取衡量旱涝程度的标准值。
对排序后的序列取0.05、0.10、0.90和0.95分位点,得到标准值,旱涝等级,共分为四个等级,定义Z值小于Z0.05为重旱(20年一遇),Z值大于Z0.95(20年一遇)为重涝,Z值大于Z0.90中涝(10年一遇),Z值小于Z0.10之间为中旱(10年一遇)。
由于各站所处位置不同,Z值服从不同的分布,标准值亦不相同,各站标准值如表1:
表1各站标准值
标准值 1安庆 2蚌埠 3毫州 4合肥 5霍山 6恩施 7老河口 8武汉 9宜昌 10常德 11零陵 12芷江 Z0.05 Z0.10 Z0.90 Z0.95 -0.69399 -0.69399 -0.69400 -0.69399 -0.69400 -0.46462 -0.46459 -0.69399 -0.46459 -0.69400 -0.69400 -0.69394 -0.58342 -0.58376 -0.58381 -0.58374 -0.58381 -0.33023 -0.33023 -0.58314 -0.33024 -0.58376 -0.58376 -0.46621 10
1.420685 1.125325 1.275879 1.198094 0.408388 1.421135 1.421278 1.422130 1.420982 2.039700 1.685871 1.678830 1.837555 1.678790 1.764669 1.678837 1.199819 1.543486 1.543810 1.837805 1.544952 2.365602 2.041890 2.041808 13东台 14赣榆 15南京 16徐州 17定海 18杭州 19衢州 20酉阳 -0.69399 -0.69400 -0.69399 -0.69400 -0.46459 -0.69400 -0.69395 -0.69400 -0.58334 -0.58381 -0.58372 -0.58381 -0.33023 -0.58376 -0.58281 -0.58377 1.422105 1.421622 1.419461 1.351709 1.421937 1.678326 1.543030 1.543100 1.837910 1.838433 1.836204 1.837586 1.543953 2.041613 1.838540 1.850822 为研究三峡工程对长江中下游地区的旱涝灾害有无影响,需要对三峡工程建设前后作对比分析。由于三峡工程1994年正式开工,1997年11月8号第一期工程完成,故将1960-1994年的12784天的Z值和1998-2010年的4536天的Z值作对比分析。
根据对旱涝程度的定义,计算各站在三峡工程建设前后各旱涝程度的天数,如下表2:
表2 各站旱涝灾害的天数
m12784 建设前重n4536 建设后重灾天数 362 382 333 355 150 381 368 348 372 108 372 344 建设前中旱天数 1502 1464 1446 1473 1511 1545 1544 1481 1538 1469 1473 1462 11
建设后中旱天数 288 310 308 297 404 237 236 287 239 317 294 317 建设前中涝天数 1318 1383 1369 1345 2480 1207 1226 1312 1212 1149 1261 1372 建设后中涝天数 408 389 392 414 511 521 512 424 523 594 468 369 灾天数 1401 1460 1357 1442 1640 1376 1393 1401 1394 719 1330 1415 1安庆 2蚌埠 3毫州 4合肥 5霍山 6恩施 7老河口 8武汉 9宜昌 10常德 11零陵 12芷江 13东台 14赣榆 15南京 16徐州 17定海 18杭州 19衢州 20酉阳 1462 1361 1387 1297 1385 1310 1366 1326 306 365 394 359 374 388 377 356 1459 1505 1492 1436 1542 1502 1486 1464 318 298 286 292 235 282 292 309 1456 1304 1289 1273 1208 1215 1286 1310 289 444 444 463 520 507 440 415 其中,m12784为建设前的总天数,n4536为建设后的总天数。
四 、统计模型
设1998-2010年的旱涝指数Z满足{ZZ0.05}{ZZ0.95}(或{ZZ0.10}或
{ZZ0.90}{ZZ)天数为X,1960-1994年的天数满足{ZZ0.0}50.95}(或
{ZZ0.1}或{ZZ0.90})天数为Y0,它们均服从二项分布,记X~b(n,p1),
Y~b(m,p2),p1p2,n4536,m12784。提出假设检验问题:
H0:0;H1:0
解决方案:
ˆ1,pˆ2的渐近正态性: 由中心极限定理可知pˆ1p1npˆ11pˆ1pmˆ2pp2N0,1
d
ˆ21pˆ2pN0,1
dˆ1pnˆ2p1p2pˆ21pˆ2pmˆ11pˆ1pN0,1
d通常基于此可对参数p1,p2进行统计推断,而这种渐近正态的效果很差,甚至当样本量很大时,上式左边与正态分布也相差很大。
4.1 参数的Fiducial分布
Fiducial推断是Fisher上世纪三十年代提出的不同于频率方法和贝叶斯方法的
12
推断方法,它不需要先验分布,而是由模型结合数据得到参数的信仰分布,进而给出兴趣参数的统计推断。
由于Fiducial方法具有良好的推断效果,于是我们寻求参数p1,p2的渐近
Fiducial分布,利用该分布对参数做统计推断。
文献[20]通过构造渐进的枢轴方程导出参数的渐进
p1,p2做logit
Fiducial分布,首先对
变换:
lp1ln1p111p1,lp2ln2p212p2
则
ˆ1lp1nlpˆ1ˆ2lp2mlpˆ2N0,1
dN0,1
d其中:
ˆ112112ˆ111pˆ1p122ˆ212pˆ2p**ˆ1ˆ1p1p
ˆ2ˆ*ˆ*p1p22
11为了避免ˆ1,ˆ2为零,在其表达式中使用p1,p2基于Jeffrey先验Beta(,)22的贝叶斯点估计:
*ˆ1px0.5n+1ˆ*,p2y0.5m+1m
按照经验10.150.755,20.150.755是一个比较好的取法。 由上式建立近似的枢轴方程
ˆ1lp1nlpˆ1ˆ2lp2mlpˆ21
n2
其中1,2i.i.d.~N0,1, 解得
13
p1=ˆ1expˆ111+11+pn11ˆ1111pˆ1pˆ1expˆ111+pˆ1n11p
p2=ˆ2expˆ221+22+pm12ˆ2212pˆ2pˆ2expˆ222+pˆ2m12p
则p1p2的给定样本下的条件分布为其近似Fiducial分布,记为F。由于F的解析表达式很难计算,我们用R软件模拟出其分位点。步骤如下:
ˆ2,ˆ2。 ˆ1,ˆ1,p(1) 基于样本x,y计算出p(2) 分别从标准正态分布中抽取样本1,2,计算p1p2,重复10000次。 (3) 将(2)中得到的p1p2按升序排列,其第10000个数为Fiducial分布F的分位点F。
4.2 参数的Fiducial检验
Tsui和 Weerahandi[21] 及 Weerahandi[22][23]提出了广义推断的概念。设随机变
量X的概率分布为P,,为参数空间上的未知参数,为所关心的实值参数函数,为讨厌参数。记为的参数空间,x为X的观测值。 对于假设检验问题:H0:0H1:0 首先引入以下定义:
定义1[21]:记RRX;x,为X和x及,的函数,如果R满足以下三条性质:
(1) rRx;x,不依赖于讨厌参数; (2) R的分布与未知参数无关;
(3) 对给定的x和,PRX;x,r|关于单调非减。
则称R为广义检验变量。
定义2[22]:设存在空间上的随机变量E,它的分布已知,并且存在从到上的函数h,e,使得当参数为时,X=h,E对一切成立,进一步,若对任意x,e,方程x=h,e在上有唯一解,记为xe。于是
14
(1)xE的分布称为的分布;
(2)xE的分布称为=的(边际)分布。
由定义知,从参数的Fiducial分布
FxPxE
易知0Fx1,并且Fx关于非减。于是可得参数的检验水平为的Fiducial检验。
对于本文的假设检验问题,拒绝域由以下命题给出
命题1:两独立随机变量X~bn,p1,Y~bm,p2,p1,p20,1,令
=p1p2,对于任意给定的01,记pFx0为检验问题
H0:0H1:0的Fiducial P值,则水平为的Fiducial检验为:
若pFx0拒绝H0,即若0F拒绝H0
证明:存在空间上的随机变量1,2i.i.d.~N0,1,由p1=1,1x,
p2=22,y,存在从到上的函数h1p1,1,h2p2,2,使得当参数为
p1,p2时,X=hp1,,Y=hp2,对一切p1,p2成立,进一步,若对任意
x,y,1,2,方程x=hp1,1,y=hp2,2在上有唯一解,记为p1x1,
p2y2。于是
(1)p1x1,p2y2的分布称为p1,p2的分布; (2)p1x1,p2y2的分布称为的(边际)分布
根据定义2,参数的Fiducial分布
FxPp1x1,p2y2
即
FxPp1x1-p2y2
易知0Fx1,并且Fx关于非减。
根据定义1,易知当RRX;x,的观测值较大时,应拒绝检验H0,于是
15
广义P值
P=supPRX;x,r|PRX;x,r|0
0对于检验假设H0:0H1:0,较小的P值表明观测值不支持原假设,pFx0拒绝H0,即0F拒绝H0。
五 、三峡工程对旱涝灾害影响的分析
5.1 检验结果
将表2中的数据按照4.1节的步骤模拟得出参数=p1p2的Fiducial分布的分位点F,如表3:
表3 20个气象站在参数的Fiducial分布0.05和0.01分位点
重灾情况重灾情况中旱情况 F0.05 F0.01 中旱情况中涝情况中涝情况F0.01 F0.05 F0.05 F0.01 1安庆 2蚌埠 3毫州 4合肥 5霍山 6恩施 7老河口 8武汉 9宜昌 -0.04501 -0.04573 -0.04794 -0.05079 -0.12000 -0.03769 -0.04245 -0.04845 -0.04198 -0.04846 -0.04923 -0.05125 -0.05449 -0.12267 -0.04159 -0.04613 -0.05180 -0.04526 -0.07340 -0.06430 -0.06283 -0.06840 -0.04536 -0.09022 -0.09007 -0.07160 -0.08900 16
-0.07671 -0.06778 -0.06625 -0.07184 -0.04928 -0.09308 -0.09316 -0.07512 -0.09213 -0.02518 -0.03653 -0.03419 -0.02620 -0.124880 0.015673 0.011447 -0.02054 0.015662 -0.02878 -0.04017 -0.03780 -0.02977 -0.12906 0.012064 0.007416 -0.02431 0.011903 10常德 11零陵 12芷江 13东台 14赣榆 15南京 16徐州 17定海 18杭州 19衢州 20酉阳 -0.04032 -0.03533 -0.05075 -0.06507 -0.04024 -0.03569 -0.03533 -0.04024 -0.02954 -0.03774 -0.03909 -0.04257 -0.03874 -0.05427 -0.06865 -0.04350 -0.03928 -0.03880 -0.04364 -0.03317 -0.04157 -0.04228 -0.06316 -0.06906 -0.06226 -0.06187 -0.07163 -0.07307 -0.06585 -0.09029 -0.07482 -0.07076 -0.06464 -0.06665 -0.07236 -0.06598 -0.06494 -0.07497 -0.07630 -0.06931 -0.09343 -0.07794 -0.07420 -0.06831 0.041558 -0.00398 -0.04039 -0.06846 -0.01412 -0.01282 -0.00610 0.01529 0.011059 -0.01359 -0.02254 0.037395 -0.00786 -0.04407 -0.07173 -0.01800 -0.01650 -0.00976 0.011441 0.007179 -0.01716 -0.02625
5.2 结果分析
根据4.2节中的结论,由上表中的数据可以看出,在重灾、中旱方面的检验,对于各个站点不同的检验水平下,0F,全部接受原假设0,即p1p2说明三峡工程建设后发生重灾和中旱的概率不大于之前发生重灾和中旱的概率,在中涝方面,有恩施、老河口、宜昌、常德、定海、杭州六个站,0F,拒绝原假设,接受备选假设0,即p1p2,但其分位点分别为0.012064、0.007416、0.011903、0.037395、0.011441、0.007179很接近于零,说明三峡工程建设后发生中涝的概率和之前发生中涝的概率差异很小。
六 、结论及评价
6.1结论
1、经过对长江中下游地区各气象站Z值的研究,发现该地区降水偏多。在1985年以前,Z值分布在上下两端的点较多,而1985年以后,点的分布较为集中,中间的点较多。可以认为1985年以后,长江中下游地区遭受的自然灾害比1985年前较少。1985年以后,各年的Z值点的分布稳定,没有太大波动,即从三峡工程建设前和建设后自然灾害发生的频数稳定。
2、通过对二项分布参数的检验,发现这两项二项分布的参数p1,p2没有显著性差异。最终得到结论,三峡工程对长江中下游地区的旱涝灾害没有影响。
6.2模型评价
本文研究内容的合理性体现在如下几个方面:
1、按照天数计算旱涝指标比按照年、月算出的值更有意义,更能反映出各
17
站所在地区旱涝的极端情况,因为在某月或某年连续一些天没有降水,而其后又连续一些天降水,这样该月或该年的平均Z指数在正常范围内,而实际上出现了旱涝急转灾害,比如今年6月份出现的极端情况。按天算出的指数既能反映出在一时间段的降水,又能反映出旱涝急转现象。
2、通过利用超过标准值的天数服从二项分布这一假设来刻画一段时间内极端灾害天气发生的概率符合统计学原理。
3、对各个站点分别处理,充分体现了长江中下游地区的天气变化特征。 4、对于二项分布的统计推断,本文利用Fiducial推断方法,而没有采用传统的频率和贝叶斯方法,因为它们在当参数接近临界值和当样本较小时统计推断结果存在一定的误差。
缺点:
本文采用的是二项分布参数的渐近Fiducial分布,寻找参数更好的Fiducial分布进行Fiducial统计推断是我们模型需要改进的地方,且由于数据的缺乏,三峡工程对气候的影响是一个长期的研究课题。
参考文献
[1] 刘祥梅等. 基于GIS的三峡库区生态环境综合评价Ⅱ气候评价[J]. 自然资源学报, 22(4):613-622.
[2] 李强等. 近30年三峡库区洪涝特征及建库前后致涝气候因子的差异[J]. 热带气象学报, 26(6):750-758.
[3] 张强等. 06三峡库区夏季高温干旱及成因分析. 观点·资讯.
[4] 张天宇等. 1961-2008年三峡库区极端高温的变化及其与区域性曾暖的关系[J] . 气象,36(12):86-93.
[5] 郑蓉. 1998年夏季长江三峡区间致洪暴雨分析[J]. 湖北气象, 2002( 4) : 6-9. [6] 赵玉春,周玉华. 三峡地区连阴雨气候特征分析[J] . 湖北气象, 2002( 4) : 3-6.
[7] 黄道友等. 应用Z指数方法判断南方季节性干旱的结果分析[J]. 中国农业气象, 2003(4):12-15.
18
[8] 魏凤英. 华北地区干旱强度的表征形式及其气候变异[J]. 自然灾害学报, 13(2):32~38. [9] 夏伟等. Z 指数法研究河北省近20年旱涝灾害发生规律. 中国气象学会2008年年会论文集, 2008: 12-18.
[10] 高建芸, 邓自旺, 周晓兰等. 基于EOF 和小波分析的福建近40年旱涝时空变化特征研究[J ] .热带气象学报, 26( 5) : 491-497.
[11] 朱亚玉等. 降水Z指数在河南旱涝监测中的应用[J] . 河南气象, 2006 ( 4) : 20-22. [12] 史印山, 姚学祥, 杨晓亮等. 华北夏季旱涝的特征分析[J]. 气象学, 28( 4) :377-383. [13] 方茸等. 基于江淮分水岭地区的Z指数修正[J]. 气象, 36 (10) : 110-113.
[14] 蔡敏等. Z指数方法在小流域洪涝灾害预警技术研究中的应用[J]. 气象科技, 38 (4) : 418-422.
[15] 李景刚等. 基于TRMM数据和区域综合Z指数的洞庭湖流域近10年旱涝特征分析[J]. 资源科学, 32 (6) : 1103-1110.
[16] Li X, Li G,Xu X. Fiducial intervals of restricted parameters and their applications. Sci China Ser A-Math, 48(11): 1567-1583(2005).
[17] Xu X, Li G. Fiducial inference in the pivotal family of distributions. Sci China Ser A-Math, 49(3):410-432(2006)
[18] 徐兴忠. 枢轴分布族中的Fiducial推断[J]. 中国科学, 36 (3) : 340-360. [19] 李新民等. 广义P值的Fiducial推断[J]. 中国科学, 37( 6) : 733-741.
[20] 熊世峰. 二项分布基于logit变换的近似信仰推断[J] . 系统科学与数学, 29(8) : 1071-1078.
[21] Tsui K W, Weerahandi S. Generalized p-values in significance testing of hypotheses in the presence of nuisance parameters. J Amer Statist Assoc, 84(406):602-607(1989) [22] Weerahandi S. Generalized confifence intervals. J Amer Statist Assoc, 88(423): 899-905(1993) .
[23] Weerahandi S. Exact Statitical Methods for DataAnalysis. NewYork:Springer -verlag, 1995.
19
附录
R程序代码: n<-4536 a1<-0
b1<-0.079805996 c1<-3.692092179 m<-12784 a2<-0
b2<-0.109590113 c2<-3.201639117 l<-10000 f<-rep(0,l) for(i in 1:l)
{v1<-rnorm(1) v2<-rnorm(1)
P1<-((1+a1)*(a1+b1)*exp(c1*v1/sqrt(n))/(1+a1-b1)-a1*(1+a1-b1))/((a1+b1)*exp(c1*v1/sqrt(n))+(1+a1-b1))
P2<-((1+a2)*(a2+b2)*exp(c2*v2/sqrt(m))/(1+a2-b2)-a2*(1+a2-b2))/((a2+b2)*exp(c2*v2/sqrt(m))+(1+a2-b2)) f[i]<-P1-P2} f1<-sort(f) f1[500] f1[100]
各站Z均值的变化曲线:
20
图1 安庆、蚌埠、毫州、合肥、霍山五站
图2 恩施、老河口、武汉、宜昌、常德五个站
21
图3 零陵、芷江、东台、赣榆、南京五站
图4 徐州、定海、杭州、衢州、酉阳五站
22
因篇幅问题不能全部显示,请点此查看更多更全内容