您所在位置：网站首页 > 研究报告 > 信息产业基于机器学习的多模型耦合径流预报研究

基于机器学习的多模型耦合径流预报研究

10页

卖家[上传人]：杨***

文档编号：475045556

上传时间：2024-05-02

文档格式：DOCX

文档大小：28.75KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

16 金贝

/ 10 举报版权申诉马上下载

文本预览

下载提示

常见问题

1、基于机器学习的多模型耦合径流预报研究祝宾皓，方威，张勇传（1.华中科技大学土木与水利工程学院，湖北武汉 430074；2.华中科技大学数字流域科学与技术湖北省重点实验室，湖北武汉 430074）0 引言洪水预报作为一种有效的防洪非工程措施，在防洪减灾紧急决策中发挥着不可替代的作用。洪水预报相关理论方法，经历了由经验模型到具有系统理论概念的黑箱模型，再到结合物理过程和经验概化的概念性水文模型，最后到反映流域空间分异性的分布式水文模型的发展过程1。然而任何一类水文模型都是对水循环过程选择性概化的近似描述，理论上无法精确还原真实水文过程。另外，在洪水预报中难以避免地存在降雨输入、模型结构以及参数的不确定性问题，前述不确定性的存在必将导致洪水预报结果的不确定性，因此探索一种强鲁棒性、高精度的洪水预报模式已成为亟待解决的问题。自19世纪40年代起，众多水文工作者已开展关于水文不确定性对洪水预报的影响研究，其中，考虑降雨输入、参数不确定性影响的研究聚焦于对误差概率分布特征的定量刻画；考虑模型结构不确定性影响的研究聚焦于模型产汇流机理的改进以及预报模型优选策略、模型耦合预报等方面。KRZ

2、YSZTOFOWICZ2提出贝叶斯洪水预报理论，应用降雨不确定性处理机（Precipitation Uncertainty Processor， PUP）和水文不确定性处理机（Hydrologic Uncertainty Processor， HUP）分别处理降雨输入不确定性和降雨以外的其他不确定性，从而明确洪水预报的总不确定性；KAVETSKI等3采用额外隐变量降低降雨输入的不确定性，提出了贝叶斯总偏差分析（BayesianTotal Error Analysis， BTEA）方法；AJAMI等4通过改用折算系数映射降雨输入的不确定性，并结合贝叶斯模型平均（Bayesian Model Averaging， BMA）方法考虑模型结构不确定性，提出了贝叶斯综合不确定性估计方法（the Integrated Bayesian Uncertainty Estimator，IBUNE）；谢小燕5将多元门限回归模型和（Artificial Neural Network， ANN）模型进行耦合预报，完成了小山水库的中长期水文预报；冯钧等6将（Back Propagation， BP）网络和（Lo

3、ng Short-Term Memory， LSTM）模型在子午河流域进行耦合预报，发现预报结果优于任一单模型的预报结果；丁武等7采用极端梯度提升树法（eXtreme Gradient Boosting， XGBoost）进行多元水文时间序列趋势相似性挖掘，达到了预测水文趋势的目的。为降低模型结构不确定性对洪水预报带来的负面影响，拟探明各水文模型的预报特征，采用多祌水文模型的不同耦合策略构建洪水耦合预报系统，以探寻研究流域产汇流机理的精细化表达，降低极端降水事件所带来的影响。1 多模型耦合方法1.1 多模型耦合预报概述水文预报是对未知水文情势的预测，无论选用什么水文模型都会有预报误差。但考虑到各个水文模型建模机制不同，在同一研究流域的预报表现也各不相同，拟综合多个模型的预报特征对研究流域的径流序列进行耦合预报。耦合预报定义如下：式中：F为最终耦合预报径流预测值；wi为各模型被分配的权重，可以是显式的也可以是隐式的；fi是第i个水文模型预测值；h为水文模型个数。1.2 单个预报模型的建立为探明研究流域的产汇流机制，综合考虑影响预报结果的各种可能因素，本研究选择基于蓄满产流理念的新安江模型

4、8、适用性较强的水箱模型9以及基于变动产流面积原理的TOPMODEL模型10，将3个模型的预测结果作为耦合模型的输入，经各耦合方法确定模型权重后，可由式（1）确定耦合预报的径流预测序列。由于（Particle Swarm Optimization， PSO）11算法已经广泛应用于水文模型的参数率定中12-14，故本研究各模型的参数以确定性系数（Determination Coefficient， DC）为目标函数，由PSO算法率定得到。确定性系数的计算如下所示：式中：Q代表实测径流序列，代表实测径流序列的平均值代表预报径流序列；n代表序列长度。1.3 最小二乘法最小二乘法是一种数学方法，它通过寻求最小误差平方和的方式找到一组数据的最优函数形式，已经在参数估计、系统辨识以及预测等专业领域中得到广泛的应用。周建中等15提供了最小二乘法在水文模型耦合预报中的应用细节。1.4 岭回归法由于前述最小二乘法在处理本文的耦合预报时容易出现结果不稳定的缺陷，故引入岭回归法16进行耦合预报。岭回归法是一种适用于多重共线性数据分析的有偏估计回归方法，可视为改进的最小二乘法。该方法放弃最小二乘估计的无偏性，

5、以损失部分信息、降低一定精度的代价获得更符合现实的回归系数17。本文的多模型耦合预报研究可归类为多重共线性问题，采用岭回归法可以更有力的挖掘多模型预报的优势，为研究流域的水文预报提供可靠保障。1.5 极端梯度提升树法极端梯度提升树，即XGBoost方法18在原始（Gradient Boosting Decision Tree， GBDT）模型的基础上进行了改造，以二阶泰勒展开方式代替GBDT模型中损失函数的一阶泰勒展开方式，增加了模型的泛化能力和对多维度数据间复杂关联的捕捉能力，该模型把正则化向的结构损失函数加入目标函数，以避免过拟合现象的发生，进一步提升了模型适用能力。本文将XGBoost算法应用于多模型耦合预报，有望精准捕捉各模型的预报特征并据此对该流域的径流序列做出符合实际的预报方案。XGBoost方法的基本原理如下：已知某样本集式中：xi为样本输入值；Xti、Yti、Zti分别为新安江模型、水箱模型和TOPMODEL模型在时刻i的预测值；n为径流序列长度；yi是样本输入值xi对应的输出值。综合Mulligan的研究，我们探讨出许多问题。其一，对于Mulligan技术操作方便，效

6、果显著，但是机制不明确；其二，研究探讨某种疾病或功能障碍时，无法给出明确纳入标准，禁忌症与适应证无明确的指南，只是通过疾病的适应症与禁忌症大体估量；其三，样本量和局限性的问题仍不能解决。目前国内与国外的差距明显。从研究内容上，国外Folk47的研究已经进展到手指关节，国内还没有研究到小关节；从研究文献的数量上，国外的研究也是领先于国内；从研究领域上，Kim48对脑卒中患者步态功能的恢复，应用动态松动术进行研究。那么XGBoost模型的目标函数可以表示为：式中：Fm代表模型在第m次迭代学习中的目标函数；式中第一项为损失函数项为第i个样本在第m-1次迭代学习中的预测值，fm(xi)为第m轮迭代学习中新加入的树基于输入值xi和上一次迭代学习误差做出的预测值；式中为正则化项，是对于模型复杂度的惩罚函数，T为叶子结点个数，为叶子权重向量，和为权重系数。为使目标函数值最小，XGBoost方法需要评估所有叶子节点，挑选能使目标函数值最小的叶子节点进行分裂，评估函数如下：最终叶子节点分裂完成且所有决策树的添加也完成时，各模型预测结果与耦合预报结果的隐特征关系就存储在XGBoost模型的结构中，再次调用

7、训练过的XGBoost模型就可计算耦合预报结果。2 应用实例2.1 研究区域概况及数据集构造雅砻江流域位于青藏高原东侧，四川西部，全长1 571 km，流域面积13.6万km2，干流狭长，支流呈树枝状均匀分布于干流两岸；河源至河口天然落差3 830 m，上游呈高山及高原景观，径流补给以冰雪为主，中下游为高原、高山峡谷河流，径流补给以降水为主，地势自西北向东南渐趋平缓；流域干湿季节明显，暴雨一般出现在6-9月，呈连续性、大范围、高强度的特点；全年径流量丰沛稳定，且空间异质性明显。因雅江吉居区间处于雅砻江流域中游和下游的分界处，径流受融雪、降水、地形各因素的影响程度不明确，故本文将其作为研究区域。研究中耦合预报采用的数据集由3 h尺度的新安江模型、水箱模型、TOPMODEL模型径流预报数据以及雅砻江流域雅江、吉居站点实测径流序列构成。其中各模型径流预报数据是本文基于雅砻江流域水电开发有限公司提供的雅江吉居区间各气象站点3 h尺度的降水、蒸发、径流资料，以2005-2010年为率定期、2011-2013年为检验期，采用PSO算法确定模型参数后计算得到。研究流域图及水文、气象站点的空间分布信息

8、见图1。图1 研究区域气象站、流量站分布图Fig.1 Distribution diagram of meteorological stations and flow stations in the study area2.2 模型性能评价指标为了从多个角度全面、准确的评价本文采用的各种耦合预报方法，本文引入确定性系数DC、均方根误差（Root Mean Square Error，RMSE）和平均绝对误差（Mean Absolute Error，MAE）3个指标对模型的预报性能、预报稳定性进行评价。其中DC的计算由式（2）给出，RMSE和MAE的计算公式如下：式中：Q代表实测径流序列代表预报径流序列；n代表序列长度。2.3 应用实例结果分析3个独立模型在3种耦合方法下的权重如表1、图2所示。表1 各模型在两种回归方法中被赋予的权重Tab.1 The weights assigned to each model in two regression methods图2 各独立模型在XGBoost中的特征重要性Fig.2 Feature importance of each independ

9、ent model in XGBoost由表1可知，最小二乘法在赋予模型权重时，易受到模型间共线性的影响，从而赋予某个预报效果较好的模型过多的权重，这导致耦合预报失去了原本的意义；相较于最小二乘法，岭回归方法能提供一组更稳定、可解释性更强的模型权重；但以上两种回归方法都是直接将权重与预测序列相乘之后得到最终预测序列，这与综合考虑各模型预报特征进行耦合预报的初衷仍有出入。在XGBoost中，特征重要性是指节点分裂时该特征带来信息增益（目标函数）优化的平均值，特征对信息增益影响程度的大小决定了重要性的大小，且由图2可知各模型的预报特征在XGBoost的建模过程中得到了充分考虑，特征重要性并未出现过大的差距。结合图2中各模型的特征重要性以及各模型的建模原理（新安江模型侧重于蓄满产流，即土壤类型；水箱模型侧重于冰雪融水；TOPMODEL侧重于地形条件），可以认为对研究流域产汇流特征影响最大的因素是冰雪融水，其次是土壤类型和地形特征，这也与雅江吉居区间地处青藏高原的地理位置相符合。3个水文模型的预测表现以及3种耦合预报方法的预测表现如表2所示（加粗指标对应的模型为该评价指标下的最优模型）。表2 模型输出结果Tab.2 Performances of all models由表2、图3可知，独立模型的预报中，不同评价指标下的最优单个水文模型也是不同的，例如新安江模型在确定性系数、均方根误差这两个指标上的表现比其余两个水文模型好，但在检验期平均绝对误差的表现上不如水箱模型。所以没有任何一个水文模型能在所有评价指标上同时表现出最优。与此同时，在同一研究流域的不同预报阶段，同一水文模型的表现也会出现差异性，例如新安江模型在洪峰阶段的拟合效果较好，但在退水阶段，新安江模型就失去了拟合优势。这是因为天然水文过程自身具有极大的随机性和非线性特征，而各模型都是在某个侧重点上实现对水文过程的概化模拟，无法完全准确的模拟水文过程，所以单个模型的预测能力是有限的，目前不存在一个最优水文模型。

《基于机器学习的多模型耦合径流预报研究》由会员杨***分享，可在线阅读，更多相关《基于机器学习的多模型耦合径流预报研究》请在金锄头文库上搜索。

点击阅读更多内容

TA的资源

员工积极主动行为的组态效应：基于过程的视角

汪晖齐物平等与跨体系社会的天下想象

函数性质中的数学抽象在问题解决与设计中的应用

日本东京大学入学考试理科数学试题解析

二次电池研究进展

实践研究与论理逻辑

光学视觉传感器技术研究进展

龙泉青瓷的传承困境与发展

齐齐哈尔地区抗根肿病大白菜品种的抗性鉴定与评价

基于系统动力学模型的胶州湾海域承载力预测

基于弯液面电化学连接碳纤维实验初探

龟甲胶研究发展探析

鼻腔黏膜免疫佐剂鞭毛蛋白的研究进展

鼻内镜辅助上颌骨部分切除术治疗鼻腔鼻窦腺样囊性癌的临床分析

黑豆不同发芽期多酚、黄酮及抗氧化活性分析

齐鲁青未了：山东当代文学审美流变论

黄登水电站机电设备安装工程施工技术质量管理

黄河文化传承视角下音乐剧创作探究

黄亦琦从风论治咳嗽变异性哮喘经验※

鲸豚动物吸附式声学行为记录器综述

点击查看更多

新上传的WORD文档

本科毕业设计---王家山煤矿开采说明书齿轮之种类蒸汽发生器项目建议书模板依法经营诚信纳税承诺书四数上册第五单元第二课时治疗白血病捐款倡议书白鹅教学设计 (2) 发电厂循环水处理规程 32细胞器——系统内的分工合作教学会计专业大四实习报告1500字教师个人年度考核总结简单格式版（七篇）.doc 精校版高中地理 1.4地球的结构教案湘教版必修1 绿色施工管理体系制度和目标广告公司保密协议样本（11篇）.doc 2023年热闹的元宵节活动总结（4篇）.doc