(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211206170.6
(22)申请日 2022.09.30
(71)申请人 河海大学
地址 210098 江苏省南京市 鼓楼区西康路1
号
(72)发明人 徐斌 莫然 孙雨 岳浩 徐孙钰
(74)专利代理 机构 南京苏高专利商标事务所
(普通合伙) 32204
专利代理师 徐红梅
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 10/06(2012.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种“输入-结构-参数 ”全要素分层组合优
选的中长期径流时变概 率预测方法
(57)摘要
本发明公开了一种 “输入‑结构‑参数”全要
素分层组合优选的中长期径流时变概率预测方
法, 包括构建径流预测因子集, 对预测因子筛选
并自由组合得到驱动因子集, 生成中长期径流单
值预测方案集; 以信息熵作为评价单值预测方案
集信息价值的指标, 采用具有内外层循环嵌套结
构的逐步回归对 方案集中的方案组合进行优选,
对最优子集生成同时包含单值过程与概率区间
的径流集合预测方案; 对径流集合预测误差进行
精细表征并生成误差情景序列, 得到考虑误差校
正的径流时变概率预测方案。 本发 明提出全要素
分层优选的中长期径流预测方法, 为水资源规划
与管理提供精准、 可靠、 稳定的预报方案信息 。
权利要求书5页 说明书14页 附图2页
CN 115496290 A
2022.12.20
CN 115496290 A
1.一种“输入‑结构‑参数”全要素分层组合优选的中长期径流时变概率预测方法, 其特
征在于, 包括以下步骤:
S1、 作为“输入‑结构‑参数”全要素分层组合优选的第一层, 对模型输入进行优选: 收集
研究区长系列中长期气象、 水文因子数据资料构建径流预测初始因子集, 基于copula熵与
径流成因分析筛选预测因子组合得到驱动因子集, 采用基于深度学习的长 短期记忆神经网
络LSTM模型生成中长期径流单值预测方案集;
S2、 作为“输入‑结构‑参数”全要素分层组合优选的第二层, 对模型结构进行优选: 以信
息熵作为评价单值预测方案集信息价值的指标, 采用具有内外层循环嵌套 结构的逐步回归
对单值预测方案集中的方案组合进行优选, 对最优子集采用贝叶斯模型平均BMA的方式生
成同时包 含单值过程与概 率区间的径流 集合预测方案;
S3、 作为“输入‑结构‑参数”全要素分层组合优选的第三层, 对模型参数进行优选: 基于
广义自回归条件异方差模型GARCH对径流预测误差进行精细表征, 利用误差的相依关系进
行实时误差校正, 结合蒙特卡洛抽样生成校正后的误差情景序列, 叠加至步骤S2中的单值
过程上得到考虑误差校正的径流时变概率预测方案, 依据径流预测 “精准度‑可靠性‑稳定
性”多维评价指标体系对得到的概 率预测方案进行评价。
2.根据权利要求1所述的一种 “输入‑结构‑参数”全要素分层组合优选的中长期径流 时
变概率预测方法, 其特 征在于, 步骤S1包括以下步骤:
S11、 径流预测初始因子集 生成;
根据研究区域气象条件, 确定控制研究区域降雨、 径流的主要天气要素, 选取相应的指
标与前期降雨、 蒸散发量以及径流 量共同组成径流预测初始因子集;
S12、 基于 copula熵与径流成因分析的驱动因子识别;
设N维随机变量(X1,X2,...,XN)具有边缘分布ui=Fi(xi),i=1,2,...,N, 其中F为累积
概率密度函数, copula熵定义 为:
其中, CE为copula熵, C为copula函数, 基于copula熵对所有与径流成因有关的预测因
子进行关联度排序, 选取排序靠前的若干因子作为驱动因子集;
S13、 基于LSTM模型的径流单值预测方案集 生成;
采用LSTM对各月的入湖径流进行预测, 以不同因子组合作 为因变量进行学习、 训练、 模
拟并进行 预测, 获得 单值预测方案集。
3.根据权利要求2所述的一种 “输入‑结构‑参数”全要素分层组合优选的中长期径流 时
变概率预测方法, 其特 征在于, 步骤S13中LSTM的计算方法为:
(a)遗忘门:
ft=σ(Wf·[ht‑1,xt]+bf)
其中, ft为当前时段的遗忘门门控, 表示控制部分历史输出信息转换为当前时段的输
入, 反映历史信息在当前时段的丢失程度, Wf为遗忘门的权重矩阵, bf为Wf的偏置项, σ 为激
活函数;
(b)输入门:
it=σ(Wi·[ht‑1,xt]+bi)权 利 要 求 书 1/5 页
2
CN 115496290 A
2其中, it为当前时段的输入门门控, 表示控制部分当前时段的输入转化为系统状态变
量, 反映当前时段的信息 输入效率, Wi为输入门的权 重矩阵, bi为Wi的偏置项;
(c)当前输入的长期状态ct':
ct'=tanh(Wc·[ht‑1,xt]+bc)
其中, Wc为当前输入的长期状态的权 重矩阵, bc为Wc的偏置项, tanh为激活函数;
(d)当前时刻的长期状态ct:
ct=ft·ct‑1+it·ct'
(e)输出门:
ot=σ(Wo·[ht‑1,xt]+bo)
其中, ot为当前时段的输出门门控, 表示控制部分系统状态变量转化为当前时段的输
出, 反映当前时段的信息 输出效率, Wo为输出门的权 重矩阵, bo为Wo的偏置项;
(f)LSTM的输出值ht:
ht=ot·tanh(ct)
将计算时段划分为训练期与校验期, 将训练期中经步骤S12中识别的驱动因子集W作为
上述计算步骤中的输入项xt, 将径流量作为其中的输出项 ht, 经神经网络的训练后率定得到
参数Wf、 bf、 Wi、 bi、 Wo、 bo, 并与校验期的输入项xt一同代入模型中计算得到对应的输出项ht,
得到一组单值预测过程, 构成单值预测方案集。
4.根据权利要求1所述的一种 “输入‑结构‑参数”全要素分层组合优选的中长期径流 时
变概率预测方法, 其特 征在于, 步骤S2包括以下步骤:
S21、 基于信息熵与逐步回归的方案集组合优选;
信息熵的表达式为:
其中, H为信息熵, X为一个具有N个离散取值的随机变量, X={x1,x2,...,xN}, 其概率分
布列
此外, 对于一个二元随机变量(X,Y), 其信息
熵又称为联合熵, 定义 为:
其中, p(x,y)为随机变量X与Y的联合概率密度函数; 联合熵表示多个随机变量包含 的
信息总量, 而其信息同量被定义 为互信息, 即:
T(X,Y)=H(X)+H(Y) ‑H(X,Y)
因此, 用信 息熵中的联合熵与互信 息分别描述单值预测方案集中各候选方案间的信 息
总量与信息同量, 并以此作为方案组合优选的依据;
S22、 基于BMA的径流单值 ‑概率集合预测方案生成;
设y为预测变量, yobs为实测样本序列, f={f1,f2,...,fk}为候选模型空间, 其中K表示
步骤S21中优选的单值预测方案组合内的候选方案组数; 根据贝叶斯理论, 假定实测与预报
序列均服从正态分布, 进一 步细化:权 利 要 求 书 2/5 页
3
CN 115496290 A
3
专利 一种“输入-结构-参数”全要素分层组合优选的中长期径流时变概率预测方法
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:25:33上传分享