(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211218175.0 (22)申请日 2022.09.30 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 申请人 建信金融科技有限责任公司 (72)发明人 陈鹏 吕书径 李霞  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 蔡舒野 (51)Int.Cl. G06Q 30/02(2012.01) G06Q 10/06(2012.01) (54)发明名称 基于样本扩展的用户分析方法、 装置、 设备 及存储介质 (57)摘要 本申请提供一种基于样本扩展的用户分析 方法、 装置、 设备及存储介质。 涉及大数据分析技 术领域。 该方法包括: 根据对象样本数据确定初 始样本, 初始样本包括多个权重等级; 确定每个 权重等级的原始等级数据; 根据原始等级数据进 行样本扩展, 得到模拟等级数据; 根据模拟等级 数据所在权重等级和对象样本数据确定模拟等 级数据的模拟最终得分; 根据初始样本和模拟等 级数据, 确定等级总体样本库; 根据初始样本确 定的初始样本最终得分和模拟等级数据的模拟 最终得分, 确定得分总体样本库; 当触发目标用 户评分请求时, 根据目标用户数据和总样本库确 定目标用户评分信息, 能够实现自动化的用户评 价, 提高用户评分的准确性。 权利要求书4页 说明书12页 附图6页 CN 115423532 A 2022.12.02 CN 115423532 A 1.一种基于样本扩展的用户分析 方法, 其特 征在于, 包括: 根据对象样本数据确定初始样本, 所述初始样本包括多个权重等级, 所述权重等级用 于表示所述对象样本数据中样本对象的重要性权 重等级; 确定每个权重等级的原始等级数据, 所述原始等级数据表示所述样本对象位于所述权 重等级的概 率; 根据所述原 始等级数据进行样本扩展, 得到模拟等级数据; 根据所述模拟等级数据所在权重等级和所述对象样本数据确定所述模拟等级数据的 模拟最终得分; 根据所述初始样本和所述模拟等级数据, 确定等级总体样本库; 根据所述初始样本确 定的初始样本最终得分和所述模拟等级数据的模拟最终得分, 确定得分总体样本库; 当触发目标用户评分请求时, 根据目标用户数据和总样本库确定目标用户评分信息, 所述总样本库包括所述 等级总体样本库和所述得分总体样本库。 2.根据权利要求1所述的方法, 其特征在于, 所述根据对象样本数据确定初始样本, 包 括: 根据对象样本数据确定每 个样本对象的最终得分; 根据所述 最终得分确定每 个样本对象的重要性权 重; 根据所述重要性权 重确定多个权 重等级。 3.根据权利要求2所述的方法, 其特征在于, 所述根据对象样本数据确定每个样本对象 的最终得分, 包括: 根据目标对象样本数据的每个指标的分位确定指标权重, 所述目标对象样本数据为任 意一个对象样本数据; 根据所述指标权 重和指标内容确定目标样本对象的最终得分。 4.根据权利要求3所述的方法, 其特征在于, 根据 所述指标权重和指标内容确定目标样 本对象的最终得分, 包括: 根据所述目标对象样本数据确定缺失指标; 根据所述指标权 重和指标内容以及所述 缺失指标确定目标样本对象的最终得分。 5.根据权利要求2所述的方法, 其特征在于, 所述根据所述最终得分确定每个样本对象 的重要性权 重, 包括: 根据层次分析法确定每 个样本对象的重要性权 重。 6.根据权利要求5所述的方法, 其特征在于, 根据层次分析法确定每个样本对象的重要 性权重, 包括: 根据多个样本对象的最终得分的比值, 确定第一矩阵, 所述第一矩阵每列对应一个样 本对象, 所述第一矩阵的元 素ij为样本对象i的最终得分与样本对象j的最终得分的比值; 根据所述第一矩阵的特 征值确定每 个样本对象的重要性权 重。 7.根据权利要求6所述的方法, 其特征在于, 所述根据所述第 一矩阵的特征值确定每个 样本对象的重要性权 重, 包括: 获取所述第 一矩阵的最大特征值以及第 一特征向量, 所述第 一特征向量为所述最大特 征值对应的特 征向量; 将所述第一特征向量进行归一化处理, 得到第二特征向量, 所述第二特征向量中的元权 利 要 求 书 1/4 页 2 CN 115423532 A 2素与样本对象一 一对应。 8.根据权利要求6所述的方法, 其特征在于, 所述根据所述第 一矩阵的特征值确定每个 样本对象的重要性权 重, 包括: 对所述第一矩阵的每列进行归一 化处理, 得到第三矩阵; 获取所述第 三矩阵每列数据的平均值, 将所述每列的平均值作为响应样本对象的重要 性权重。 9.根据权利要求2所述的方法, 其特征在于, 根据所述重要性权重确定多个权重等级, 包括: 根据重要性权 重的数值进行排序; 根据排序结果确定多个权 重等级, 每 个权重等级包 含的样本对象数量接 近或相等。 10.根据权利要求1所述的方法, 其特征在于, 所述根据所述原始等级数据进行样本扩 展, 得到模拟等级样本, 包括: 通过蒙特卡洛算法对原 始等级数据进行扩展, 得到扩展数据; 将所述原 始等级数据和所述扩展数据进行合并, 得到合并数据; 根据EM算法和扩展数据对蒙特卡洛算法的扩展参数进行调整, 直至所述合并数据的概 率分布固定; 根据调整后的蒙特卡洛算法对所述原 始等级数据进行扩展, 得到模拟等级样本 。 11.根据权利要求1所述的方法, 其特征在于, 所述当触发 目标用户评分请求 时, 根据目 标用户数据和总样本库确定目标用户评分信息, 包括: 当触发目标用户评级请求时, 获取目标用户最终得分; 将所述目标用户最终得分合并至所述得分总体样本库, 得到新得分总体样本库; 根据所述 新得分总体样本库确定目标用户权 重估计值; 根据所述目标用户权 重估计值和所述 等级总体样本库确定目标用户等级; 根据所述目标用户等级反馈目标用户评级信息 。 12.根据权利要求1所述的方法, 其特征在于, 在根据所述初始样本和所述模拟等级数 据, 确定等级总体样本库; 根据所述初始样本确定的初始样本最终得分和所述模拟等级数 据的模拟最终得分, 确定得分总体样本库之后, 还 包括: 根据样本等级变化确定优质样本特 征; 若目标用户特 征与所述优质样本特 征匹配, 输出目标用户的推荐信息 。 13.一种基于样本扩展的用户分析装置, 其特 征在于, 包括: 初始样本确定模块, 用于根据对象样本数据确定初始样本, 所述初始样本包括多个权 重等级, 所述权 重等级用于表示所述对象样本数据中样本对象的重要性权 重等级; 原始等级数据确定模块, 用于确定每个权重等级的原始等级数据, 所述原始等级数据 表示所述样本对象位于所述权 重等级的概 率; 模拟等级数据生成模块, 用于根据所述原始等级数据进行样本扩展, 得到模拟等级数 据; 模拟得分确定模块, 用于根据 所述模拟等级数据 所在权重等级和所述对象样本数据确 定所述模拟等级数据的模拟最终得分; 总样本库确定模块, 用于根据所述初始样本和所述模拟等级数据, 确定等级总体样本权 利 要 求 书 2/4 页 3 CN 115423532 A 3

PDF文档 专利 基于样本扩展的用户分析方法、装置、设备及存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 基于样本扩展的用户分析方法、装置、设备及存储介质 第 1 页 专利 基于样本扩展的用户分析方法、装置、设备及存储介质 第 2 页 专利 基于样本扩展的用户分析方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:25:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。