(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211208159.3 (22)申请日 2022.09.30 (71)申请人 合肥工业大 学 地址 230009 安徽省合肥市包河区屯溪路 193号 (72)发明人 钱晓飞 王新悦 刘心报 郑锐  程浩 胡朝明  (74)专利代理 机构 北京久诚知识产权代理事务 所(特殊普通 合伙) 11542 专利代理师 余罡 (51)Int.Cl. G06Q 10/00(2012.01) G06N 3/12(2006.01) G06Q 10/04(2012.01) G06Q 10/06(2012.01) (54)发明名称 面向船舶主动力设备维修订单的动态调度 方法及系统 (57)摘要 本发明提供一种面向船舶主动力设备维修 订单的动态调度方法及系统, 涉及分布式多项目 调度技术领域。 本发明以各订单工期最小化为目 标, 使用基于关键链改进搜索的遗传算法生成各 订单对应的本地调度计划和各订单的全局资源 需求; 然后基于上述本地调度计划和全局资源需 求进行全局资源动态调度, 并利用深度强化学习 方法获取发生全局资源冲突时的全局资源分配 方案, 各订单根据该全局资源分配方案调整本地 调度计划并更新全局资源需求; 最后不断重复执 行上述过程直至各订单在进行全局资源动态调 度过程时不存在全局资源冲突时结束调度, 并输 出此时各订单所对应的最终调度计划和全局资 源分配方案 。 权利要求书3页 说明书16页 附图5页 CN 115271130 A 2022.11.01 CN 115271130 A 1.一种面向船舶主动力设备维修 订单的动态调度方法, 其特 征在于, 所述方法包括: S1、 以各订单工期最小化为目标, 使用基于关键链改进搜索的遗传算法生成各订单对 应的本地调度计划 和各订单的全局资源需求; S2、 基于各订单的所述本地调度计划和各订单的所述全局资源需求进行全局资源动态 调度, 以分布式多订单总工期最小化为 目标, 利用深度强化学习方法获取各订单调整后的 本地调度计划 和各订单调整后的全局资源需求并进行 更新; S3、 重复执行S1和S2直至各个订单在进行全局资源动态调度 过程不存在全局资源冲 突 时结束调度过程, 并输出此时各订单所对应的最 终调度计划和最 终的全局资源需求作为全 局资源动态调度的调度结果。 2.如权利要求1所述的方法, 其特 征在于, 所述S1包括: S11、 初始化本地调度算法的初始种群, 并设置所述本地调度算法的输入参数和执行参 数; 所述本地调 度算法包括关键链改进搜索的遗传算法; 所述执行参数包括最大迭代次数、 交叉概率、 变异概 率, 以及改进搜索概 率; S12、 对所述初始种群依次执行包括选择、 交叉、 变异、 以及基于改进关键链搜索的操 作, 并计算经 过所述操作后个 体的适应度值并更新种群; S13、 判断是否达到所述最大迭代次数, 若否, 则循环执行S12; 若是, 本地调度算法结 束, 并输出本地调度计划以及各订单的全局资源需求。 3.如权利要求2所述的方法, 其特征在于, 所述基于改进关键链搜索的操作包括: 以改 进搜索概 率pf执行基于关键链的改进搜索算子, 具体操作为: 对选中的染色体执 行前向后向调度生成机制并确定关键维修任务 集合; 随机选择一个关键维修任务并记其当前位置为 c,找到其紧前维修任务所在的最大位 置a和紧后维修任务所在的最小位置 b; 若c≥a+2且对该关键维修任务位置的提前不会造成其他关键维修任务的推迟, 则将关 键维修任务 提前至位置 ( a+1) 。 4.如权利要求1所述的方法, 其特 征在于, 所述S2包括: S21、 基于各订单的所述本地调度计划确定各订单在各时段的全局资源需求是否存在 资源冲突, 确定决策时间点; S22、 将所述全局资源动态调度的问题转 化为马尔可 夫决策过程; S23、 利用深度强化学习方法求解所述马尔可夫决策过程, 以获得全局资源动态调度的 调度结果。 5.如权利要求4所述的方法, 其特征在于, 所述S23、 利用深度强化学习方法求解所述马 尔可夫决策过程, 以获得全局资源动态调度的调度结果包括: S231、 资源代 理根据协调 代理选择的动作唯一确定的冲突项目优先列表生成冲突维修 任务优先序列, 执行该动作, 安排冲突维修任务的开始时间并完成全局资源的分配, 将 重新 安排后各个冲突维修任务的开始时间发送给项目代理; S232、 每个项目经理根据资源代 理发送的冲突维修任务开始时间和全局资源分配方案 调整本地调度计划, 并将调整后的各时段的全局资源需求和本地调度计划返回给资源代 理, 更新状态; S233、 资源代理识别下一个决策点状态和下一个预处 理序列, 观察奖励;权 利 要 求 书 1/3 页 2 CN 115271130 A 2S234、 获得样本并存 储于经验 池中, 随机抽取小批量样本; S235、 协调代理根据Q目标网络计算TD目标值; S236、 协调代理计算每个样本的TD目标差, 在损失函数上执行Adam优化, 每隔C步重设Q 目标网络的模 型参数值与Q预测网络相等; 其中, 所述Q目标网络和所述Q预测网络结构 完全 相同。 6.一种面向船舶主动力设备维修 订单的动态调度系统, 其特 征在于, 所述系统包括: 本地调度计划获取模块, 用于以各订单工期最小化为目标, 使用基于关键链改进搜索 的遗传算法生成各订单对应的本地调度计划 和各订单的所述全局资源需求; 本地调度计划更新模块, 用于以分布式多订单总工期最小化为目标, 基于各订单的所 述本地调度计划和各订单的所述全局资源需求进 行全局资源动态调 度, 利用深度强化学习 方法获取 各订单调整后的本地调度计划 和各订单调整后的全局资源需求并进行 更新; 全局调度计划获取模块, 用于当本地调度计划获取模块和本地调度计划更新模块重复 执行动作且各订单在进行全局资源动态调 度过程中不存在 全局资源冲突时结束调度过程, 并输出此时各订单所对应的最终调度计划和 最终的全局资源需求作为全局资源动态调度 的调度结果。 7.如权利要求6所述的系统, 其特征在于, 所述本地调度计划获取模块以各订单工期最 小化为目标, 使用基于 关键链改进搜索的遗传算法生成各订单对应的本地调 度计划和各订 单的所述全局资源需求包括: S11、 初始化本地调度算法的初始种群, 并设置所述本地调度算法的输入参数和执行参 数; 所述本地调 度算法包括关键链改进搜索的遗传算法; 所述执行参数包括最大迭代次数、 交叉概率、 变异概 率, 以及改进搜索概 率; S12、 对所述初始种群依次执行包括选择、 交叉、 变异、 以及基于改进关键链搜索的操 作, 并计算经 过所述操作后个 体的适应度值并更新种群; S13、 判断是否达到所述最大迭代次数, 若否, 则循环执行S12; 若是, 本地调度算法结 束, 并输出本地调度计划以及各订单的全局资源需求。 8.如权利要求7 所述的系统, 其特 征在于, 所述基于改进关键链搜索的操作包括: 以改进搜索概 率pf执行基于关键链的改进搜索算子, 具体操作为: 对选中的染色体执 行前向后向调度生成机制并确定关键维修任务 集合; 随机选择一个关键维修任务并记其当前位置为 c, 找到其紧前维修任务所在的最大位 置a和紧后维修任务所在的最小位置 b; 若c≥a+2, 且对该关键维修任务位置的提前不会造成其他关键维修任务的推迟, 则将 关键维修任务 提前至位置 ( a+1) 。 9.如权利要求6所述的系统, 其特征在于, 所述本地调度计划更新模块基于各订单的所 述本地调度计划和各订单的所述全局资源需求进 行全局资源动态调 度, 利用深度强化学习 方法获取 各订单调整后的本地调度计划 和各订单调整后的全局资源需求并进行 更新包括: S21、 基于各订单的所述本地调度计划确定各订单在各时段的全局资源需求是否存在 资源冲突; S22、 将所述全局资源动态调度的问题转 化为马尔可 夫决策过程; S23、 利用深度强化学习方法求解所述马尔可夫决策过程, 以获得全局资源动态调度的权 利 要 求 书 2/3 页 3 CN 115271130 A 3

PDF文档 专利 面向船舶主动力设备维修订单的动态调度方法及系统

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 面向船舶主动力设备维修订单的动态调度方法及系统 第 1 页 专利 面向船舶主动力设备维修订单的动态调度方法及系统 第 2 页 专利 面向船舶主动力设备维修订单的动态调度方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:25:31上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。