专利基于改进Stacking算法预测地面合成电场的方法 -在线下载 -pdf文件-shop.720life.cn

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211214405.6 (22)申请日 2022.09.30 (71)申请人三峡大学地址 443002 湖北省宜昌市西陵区大学路8 号 (72)发明人李振华　吴慕聪　黄悦华　李振兴　徐艳春　杨楠　邾玢鑫　张磊　张文婷　程紫熠　唐轩　 (74)专利代理机构宜昌市三峡专利事务所 42103 专利代理师吴思高 (51)Int.Cl. G06F 30/27(2020.01) G06F 17/18(2006.01) G06Q 10/04(2012.01)G06Q 10/06(2012.01) G06Q 50/06(2012.01) G06N 20/00(2019.01) (54)发明名称基于改进Stacking算法预测地面合成电场的方法 (57)摘要基于改进Stacking算法预测地面合成电场的方法，包括以下步骤：获取样本数据，包括地面合成电场数据、气象数据；对获得的样本数据进行预处理，包括异常值检测与归一化处理；使用五折交叉验证法对已经处理好的样本数据进行预测建模，使用改进的Stacking算法预测模型进行合成电场预测。使用均方误差MSE，均方根误差 RMSE，平均绝对误差MAE来评估改进的Stacking 算法预测模型性能。本发明方法采用预测精度较高的机器学习算法作为基学习器，相较于传统合成电场预测方法，机器学习预测能充分考虑复杂环境对地面合成电场的影响。权利要求书2页说明书7页附图4页 CN 115544879 A 2022.12.30 CN 115544879 A 1.基于改进Stack ing算法预测地面合成电场的方法，其特征在于包括以下步骤：步骤1：获取样本数据，包括地面合成电场数据、气象数据；步骤2：对步骤1 获得的样本数据进行预处理，包括异常值检测与归一化处理；步骤3：使用五折交叉验证法对步骤2已经处理好的样本数据进行预测建模，得到改进的Stacking算法预测模型；步骤4：使用步骤3改进的Stack ing算法预测模型进行合成电场预测。 2.根据权利要求1所述基于改进Stacking算法预测地面合成电场的方法，其特征在于：还包括步骤5：使用均方误差MSE，均方根误差RMSE，平均绝对误差MAE来评估改进的 Stacking算法预测模型性能。 3.根据权利要求1所述基于改进Stacking算法预测地面合成电场的方法，其特征在于：所述步骤1 中，合成电场数据为采集的特高压输电线下地面合成场强，单位： kV/m；气象数据包括温度、湿度、气压、风速、 PM1.0、 PM2.5、 PM10 。 4.根据权利要求1所述基于改进Stacking算法预测地面合成电场的方法，其特征在于：所述步骤2中，使用的异常值检测方法为局部离群因子LOF算法，局部离群因子LOF算法通过距离和密度的计算，来对数据集中各点异常程度进行量化。 5.根据权利要求4所述基于改进Stacking算法预测地面合成电场的方法，其特征在于：所述步骤2中，使用的归一化处理方法为其中： S是各个特征归一化的结果； s是各个特征的原始数据； Smax和Smin是各个特征的最大值和最小值。 6.根据权利要求1所述基于改进Stacking算法预测地面合成电场的方法，其特征在于：所述步骤3包括以下步骤： S3.1：对初始数据进行归一化处理后，得到数据集G＝{(yi,xi)； i＝1,2, …M},xi为第i 个样本特征向量， yi为第i个样本对应的输出值； M为采集的合成电场样本数量； S3.2：将数据集G划分为训练集Gtrain和测试集Gtest，其中，训练集样本数量为N，测试集样本数量为M ‑N，对训练集Gtrain使用五折交叉验证方式来训练第一层的基学习器：将Gtrain 平均分成五份得到Gtrain1、 Gtrain2、 Gtrain3、 Gtrain4、 Gtrain5，将其分别作为不同基学习器的测试集和训练集；依次选择其中的一折作为测试集，剩余的四折作为训练集，五次训练过程中基学习器 Hk， k＝1,…,K的预测结果表示为zkn， k表示第一层基学习器的序号， K表示第一层基学习器的数量；最终K个基学习器的输出结果与Gtrain中的yn组成第二层元学习器使用的新训练集: Gtrain‑new＝{(yn,z1n,…,zkn)； n＝1,…,N,k＝1,…,K}；其中： n表示训练集中样本序号， N表示训练集样本数量； yn表示n个样本对应的预测值； z1n,…,zkn表示K个基学习器根据N个样本预测的得出的新的合成电场数据； S3.3：在S3.2五折交叉验证过程中，每一折交叉验证都会训练一次基学习器Hk，通过每次训练好的基学习器Hk对测试集Gtest中的yi进行预测，最终五折交叉验证结束后，每个基学习器输出的Gtest预测值Pkn为： Pkn＝(Pkn1+Pkn2+Pkn3+Pkn4+Pkn5)/5；其中， Pkn1、 Pkn2、 Pkn3、 Pkn4、 Pkn5分别为第k个基学习器经过五次不同训练后对测试集Gtest权　利　要　求　书 1/2 页 2 CN 115544879 A 2输出的预测值， Pkn为第k个基学习器对测试集Gtest输出的预测值的平均值， n为测试集Gtest 样本数目；最终K个基学习器输出的结果与Gtest中yi组成第二层元学习器使用的新测试集： Gtest‑new＝{(yn,P1n,…,Pkn)； n＝1,…,M‑N,k＝1,…,K}； P1n,…,Pkn表示K个基学习器根据m ‑N个样本预测的得出的新的合成电场数据； S3.4：通过新训练集Gtrain‑new训练第二层元学习器，并使用新测试集Gtest‑new对模型的精度进行检测。 7.根据权利要求1所述基于改进Stacking算法预测地面合成电场的方法，其特征在于：所述步骤4中，改进的St acking算法预测模型的第一层基学习器选择学习能力较强且结构上存在较大差异的随机森林RF、梯度提升决策树GBDT、轻量级梯度提升机LightGBM、极限梯度提升树XGBoost、 K近邻算法KNN这五种预测算法，在第二层元学习器选择线性回归模型作为进行最终的预测；具体为：第一层基学习器基于实测合成电场数据划分得到的训练集和测试集进行预测，具体为：将训练集预测结果及初始训练集组合作为第二层元学习器的训练集；将测试集预测结果及初始测试集组合作为第二层元学习器的测试集；线性回归模型用来描述变量y和x之间的随机线性关系，即： y＝β0+β1x1+β2x2+…+βnxn+ξ，其中， x1,…,xk是非随机的变量，此处具体为温度、湿度、气压、风速、 PM10、 PM2.5、 PM1.0这7 个气象因素； β0, β1…βn为回归系数； ξ是随机误差项； y为随机的因变量，此处具体为合成电场预测值。 8.根据权利要求2所述基于改进Stacking算法预测地面合成电场的方法，其特征在于：所述步骤5中，均方误差公式为：均方根误差公式为：平均绝对误差公式为：其中： yi和代表真实值和预测值； n代表预测值与真实值的数量；当均方误差、均方根误差和平均绝对误差越小，说明该算法对地面合成电场预测效果越好。权　利　要　求　书 2/2 页 3 CN 115544879 A 3

专利 基于改进Stacking算法预测地面合成电场的方法

专利基于改进Stacking算法预测地面合成电场的方法