(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211073242.4 (22)申请日 2022.09.02 (71)申请人 浙江工商大 学 地址 310018 浙江省杭州市下沙高教园区 学正街18号 (72)发明人 宋超 王捷 杨柏林  (74)专利代理 机构 杭州奥创知识产权代理有限 公司 33272 专利代理师 王佳健 (51)Int.Cl. G06F 30/13(2020.01) G06F 30/27(2020.01) G06N 5/04(2006.01) G06N 3/04(2006.01) (54)发明名称 一种基于深度学习和细粒度优化的室内场 景合成方法 (57)摘要 本发明公开了一种基于深度学习网络和细 粒度优化的室内场景合成方法。 本发 明首先划分 数据集, 后通过特征编码分支, 得到家具和场景 的特征序列。 其次采用随机置换函数将家具的特 征序列进行打乱和场景特征序列进行拼接, 放入 特征融合编码器得到全局特征, 并利用残差结构 将家具种类特征输入到特征解码分支中, 得到位 置分布和角度分布。 然后对网络进行训练, 再提 取数据集中不同类型家具的绝对位置分布和相 对位置分布, 进行前向推理; 并利用碰撞检测模 块初步筛选预测结果。 最后对预测结果进行细粒 度优化。 本发 明在不增加整个网络模块以及不影 响预测速度的前提下, 提高了室内场景合成任务 的精确度。 权利要求书2页 说明书7页 附图8页 CN 115422640 A 2022.12.02 CN 115422640 A 1.一种基于深度学习和细粒度优化的室内场景合成方法, 其特征在于包括以下具体步 骤: 步骤1、 将室内家具场景 数据集划分为训练集、 验证集和 测试集; 将测试集室内场景的二进制俯视图及用户指定的家具模型组的信 息, 输入至特征编码 分支, 进行 特征编码, 分别得到家具和场景的特 征序列; 步骤2、 采用随机置换函数将家具的特征序列进行打乱, 之后和场景特征序列进行拼 接, 放入到特 征融合编码器t ransformer ‑encoder中, 得到全局特 征; 步骤3、 将全局特征输入特征解码分支, 并利用残差结构将家具种类特征输入到特征解 码分支中, 分别得到家具位置分布和角度分布; 步骤4、 对网络进行训练, 多分类损失为负对数似然损失; 步骤5、 提取 数据集中不同类型家具的绝对位置分布和相对位置分布; 对于每一个家具的绝对位置和不同家具之间的相对位置, 分别利用四维高斯混合模型 和六维高斯混合模型对这两个属性进行建模; 步骤6、 使用训练好的网络进行前向推理, 对得到的家具位置和角度分布采用多分类的 形式采样, 得到网络对每一个家具 预测的位置和角度; 利用碰撞检测模块对所有家具进行计算, 挑出碰撞最小的一个场景作为初步筛选的预 测结果; 步骤7、 利用高斯混合模型以及碰撞检测模块构造损失函数, 对预测结果进行细粒度优 化, 得到优化后每一个家具的位置 。 2.根据权利要求1所述的一种基于深度学习和细粒度优化的室内场景合成方法, 其特 征在于: 步骤2所述特征融合编码器由自注意力Self ‑Attention层、 Add&Norm层和FNN层组 成; 特征融合编码器主 要工作流 程如下: S1,通过自注意力层, 分别计算场景特征及所有家具特征对应 的Query、 Key和Value矩 阵; 通过不同家具以及场景特征之间的Query与Key矩阵相乘, 得到相关性权重矩阵, 然后根 据相关性权重矩阵乘上对应位置的Value矩阵值, 得到每一个家具根据场景特征和其它家 具特征预测出的高维特 征; S2,通过Add&Norm层, 其 中Add是采用残差结构将自注意力层的输入和预测后的高维特 征直接相加; N orm是将相加后的结果进行归一 化处理; S3,通过FNN层, 即通过全连接层将S2的输出进行映射, 并通过Relu激活函数后再降维, 得到最终每一个家具的特 征; S4,通过Ad d&Norm层, 具体操作步骤与S2相同。 3.根据权利要求1所述的一种基于深度学习和细粒度优化的室内场景合成方法, 其特 征在于: 步骤3所述特征解码分支包括位置解码 器和角度解码器, 分别对特征融合编 码器融 合后的特 征进行解码。 4.根据权利要求1所述的一种基于深度学习和细粒度优化的室内场景合成方法, 其特 征在于: 步骤7所述构造损失函数, 是将预测位置放入高斯混合模型中得到预测值相较于先 验的偏移量函数, 将此偏移量函数与碰撞检测模块根据权重结合起来, 得到最终的损失函 数;权 利 要 求 书 1/2 页 2 CN 115422640 A 2采用L‑BFGS算法对最终的损失函数进行优化。 5.根据权利要求1所述的一种基于深度学习和细粒度优化的室内场景合成方法, 其特 征在于: 构建并行的特征融合编 码器架构, 并构建 并行的特征解码分支, 对经过特征融合编 码器融合的特 征直接解码。权 利 要 求 书 2/2 页 3 CN 115422640 A 3

PDF文档 专利 一种基于深度学习和细粒度优化的室内场景合成方法

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于深度学习和细粒度优化的室内场景合成方法 第 1 页 专利 一种基于深度学习和细粒度优化的室内场景合成方法 第 2 页 专利 一种基于深度学习和细粒度优化的室内场景合成方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:46:30上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。