(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211214405.6
(22)申请日 2022.09.30
(71)申请人 三峡大学
地址 443002 湖北省宜昌市西陵区大 学路8
号
(72)发明人 李振华 吴慕聪 黄悦华 李振兴
徐艳春 杨楠 邾玢鑫 张磊
张文婷 程紫熠 唐轩
(74)专利代理 机构 宜昌市三峡专利事务所
42103
专利代理师 吴思高
(51)Int.Cl.
G06F 30/27(2020.01)
G06F 17/18(2006.01)
G06Q 10/04(2012.01)G06Q 10/06(2012.01)
G06Q 50/06(2012.01)
G06N 20/00(2019.01)
(54)发明名称
基于改进Stacking算法预测地面合成电场
的方法
(57)摘要
基于改进Stacking算法预测地面合成电场
的方法, 包括以下步骤: 获取样本数据, 包括地面
合成电场数据、 气象数据; 对获得的样本数据进
行预处理, 包括异常值检测与归一化处理; 使用
五折交叉验证法对已经处理好的样本数据进行
预测建模, 使用改进的Stacking算 法预测模型进
行合成电场预测。 使用均方误差MSE, 均方根误差
RMSE, 平均绝对误差MAE来评估改进的Stacking
算法预测模 型性能。 本发明方法采用预测精度较
高的机器学习算法作为基学习器, 相较于传统合
成电场预测方法, 机器学习预测能充分考虑复杂
环境对地 面合成电场的影响。
权利要求书2页 说明书7页 附图4页
CN 115544879 A
2022.12.30
CN 115544879 A
1.基于改进Stack ing算法预测地 面合成电场的方法, 其特 征在于包括以下步骤:
步骤1: 获取样本数据, 包括 地面合成电场数据、 气象数据;
步骤2: 对步骤1 获得的样本数据进行 预处理, 包括异常值检测与归一 化处理;
步骤3: 使用五折交叉验证法对步骤2已经处理好的样本数据进行预测建模, 得到改进
的Stacking算法预测模型;
步骤4: 使用步骤3改进的Stack ing算法预测模型进行合成电场预测。
2.根据权利 要求1所述基于改进Stacking算法预测地面合成电场的方法, 其特征在于:
还包括步骤5: 使用均方误差MSE, 均方根误差RMSE, 平均绝对误差MAE来评估改进的
Stacking算法预测模型性能。
3.根据权利 要求1所述基于改进Stacking算法预测地面合成电场的方法, 其特征在于:
所述步骤1 中, 合成电场数据为采集的特高压输电线 下地面合 成场强, 单位: kV/m; 气象数据
包括温度、 湿度、 气压、 风速、 PM1.0、 PM2.5、 PM10 。
4.根据权利 要求1所述基于改进Stacking算法预测地面合成电场的方法, 其特征在于:
所述步骤2中, 使用的异常值检测方法为局部离群因子LOF算法, 局部离群因子LOF算法通过
距离和密度的计算, 来对数据集中各点异常程度进行量 化。
5.根据权利 要求4所述基于改进Stacking算法预测地面合成电场的方法, 其特征在于:
所述步骤2中, 使用的归一 化处理方法为
其中: S是各个特征归一化的结果; s是各个特征的原始数据; Smax和Smin是各个特征的最
大值和最小值。
6.根据权利 要求1所述基于改进Stacking算法预测地面合成电场的方法, 其特征在于:
所述步骤3包括以下步骤:
S3.1: 对初始数据进行归一化处理后, 得到数据集G={(yi,xi); i=1,2, …M},xi为第i
个样本特 征向量, yi为第i个样本对应的输出值; M为采集的合成电场样本数量;
S3.2: 将数据集G划分为训练集Gtrain和测试集Gtest, 其中, 训练集样本数量为N, 测试集
样本数量为M ‑N, 对训练集Gtrain使用五折交叉验证方式来训练第一层的基学习器: 将Gtrain
平均分成五份得到Gtrain1、 Gtrain2、 Gtrain3、 Gtrain4、 Gtrain5, 将其分别作为不同基学习器的测试
集和训练集;
依次选择其中的一折作为测试集, 剩余的四折作为训练集, 五次训练过程中基学习器
Hk, k=1,…,K的预测结果表示为zkn, k表示第一层基学习器的序号, K表示第一层基学习 器
的数量;
最终K个基学习器的输出 结果与Gtrain中的yn组成第二层元 学习器使用的新训练集:
Gtrain‑new={(yn,z1n,…,zkn); n=1,…,N,k=1,…,K};
其中: n表示训练集中样本序号, N表示训练集样本数量; yn表示n个样本对应的预测值;
z1n,…,zkn表示K个基学习器根据N个样本预测的得 出的新的合成电场数据;
S3.3: 在S3.2五折交叉验证过程中, 每一折交叉验证都会训练一次基学习 器Hk, 通过每
次训练好的基学习器Hk对测试集Gtest中的yi进行预测, 最 终五折交叉验证结束后, 每个基学
习器输出的Gtest预测值Pkn为: Pkn=(Pkn1+Pkn2+Pkn3+Pkn4+Pkn5)/5;
其中, Pkn1、 Pkn2、 Pkn3、 Pkn4、 Pkn5分别为第k个基学习器经过五次不同训练后对测试集Gtest权 利 要 求 书 1/2 页
2
CN 115544879 A
2输出的预测值, Pkn为第k个基学习器对测试集Gtest输出的预测值的平均值, n为测试集Gtest
样本数目;
最终K个基学习器输出的结果与Gtest中yi组成第二层元 学习器使用的新测试集:
Gtest‑new={(yn,P1n,…,Pkn); n=1,…,M‑N,k=1,…,K};
P1n,…,Pkn表示K个基学习器根据m ‑N个样本预测的得 出的新的合成电场数据;
S3.4: 通过新训练集Gtrain‑new训练第二层元学习器, 并使用新测试集Gtest‑new对模型的精
度进行检测。
7.根据权利 要求1所述基于改进Stacking算法预测地面合成电场的方法, 其特征在于:
所述步骤4中, 改进的St acking算法预测模型的第一层基学习器选择学习能力较强且结构
上存在较大差异的随机森 林RF、 梯度提升决策树GBDT、 轻量级梯度提升机LightGBM、 极限梯
度提升树XGBoost、 K近邻算法KNN这 五种预测算法, 在第二层元学习器选择线性回归模 型作
为进行最终的预测; 具体为:
第一层基学习器基于实测合成电场数据划分得到的训练集和测试集进行预测, 具体
为: 将训练集预测结果及初始训练集组合作为第二层元学习器的训练集; 将测试集预测结
果及初始测试集组合作为第二层元 学习器的测试集;
线性回归模型用来描述变量y和x之间的随机线性关系, 即: y=β0+β1x1+β2x2+…+βnxn+ξ,
其中, x1,…,xk是非随机的变量, 此处具体为温度、 湿度、 气压、 风速、 PM10、 PM2.5、 PM1.0这7
个气象因素; β0, β1…βn为回归系数; ξ是随机误差项; y为随机的因变量, 此处具体为合成电
场预测值。
8.根据权利 要求2所述基于改进Stacking算法预测地面合成电场的方法, 其特征在于:
所述步骤5中, 均方误差公式为:
均方根误差公式为:
平均绝对误差公式为:
其中: yi和
代表真实值和预测 值; n代表预测 值与真实值的数量; 当均方误差、 均方根
误差和平均绝对误差越小, 说明该算法对地 面合成电场预测效果越好。权 利 要 求 书 2/2 页
3
CN 115544879 A
3
专利 基于改进Stacking算法预测地面合成电场的方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:25:31上传分享