(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211211389.5 (22)申请日 2022.09.30 (71)申请人 合肥工业大 学 地址 230009 安徽省合肥市包河区屯溪路 193号 (72)发明人 冯晨鹏 常圣卿 丁晶晶 郝泽林  (74)专利代理 机构 武汉菲翔 知识产权代理有限 公司 42284 专利代理师 梁燕飞 (51)Int.Cl. G06K 9/62(2022.01) G06Q 10/06(2012.01) G06Q 40/02(2012.01) (54)发明名称 一种基于大规模DEA快速求解算法的银行信 用卡异常数据识别方法 (57)摘要 本发明公开了一种基于大规模DEA快速求解 算法的银行信用卡异常数据 识别方法, 该基于大 规模DEA快速求解算法的银行信用卡异常数据 识 别方法, 通过DEA方法识别海量信用卡数据点之 中的“异常值”基于DEA方法来识别异常值点, 有 其特有的优势, 因为每个数据点往往包含多个属 性值, 但当数据点的所有属性值组合起来, 则有 可能是异常点, DEA方法可以很好地识别这种情 况然而, 信用卡数据点往往存在数据量大、 多属 性、 快速分析、 快速响应等特点, 在利用DEA进行 异常数据识别时, 会出现无法计算或者计算时间 过长的挑战, 本发明提出一种大规模DEA快速求 解算法, 用以及时识别大规模 银行信用卡数据的 异常情况, 从而帮助银行对信用卡用户审计、 评 估。 权利要求书4页 说明书9页 CN 115526260 A 2022.12.27 CN 115526260 A 1.本发明提供一种基于大规模DEA快速求解算法的银行信用卡异常数据识别方法, 其 特征在于, 包括以下步骤: S1: 确定决策单元(D ecision‑Making Unit, DMU), 选取一定时间内, 银行产生的信用卡 数据, 假设有n个用户数据, 将其视为 n个决策单元(DMUj(j=1,2,. ...n)); S2: 选择信用卡数据中的关键属性包括所选时间段内的薪酬水平、 个人资产、 个人负 债、 交易频率、 交易金额、 大宗消费数量, 根据不同情况, 选择不同指标作为投入产出指标, 记有m个投入指标和s个产出指标, 并由n个DMU的投入产出 数据组成基础数据集, 记为T; S3: 通过大规模DEA快速求解算法快速分析上述信用 卡数据集T, 求得每个DMU的效率 值; S4: 设定阈值, 将DEA效率 值大于等于 0.99的DMU识别为异常DMU, 找出异常DMU; S5: 分析被判定为异常DMU的用户, 判断异常原因, 处 理信用卡方面的对应问题。 2.根据权利要求1中所述的一种基于大规模DEA快速求解算法的银行信用卡异常数据 识别方法, 其特 征在于, 所 涉及到的DEA基础内容包括: DEA‑BCC投入导向模型的包络形式如模型(1)所示: 在模型(1)中, 被评价单元为DMUk, 其中k=1,2,...,n, xik(i=1,2,...,m)为被评价单 元的第i个投入, yrk(r=1,2,...,s)为被评价单元的第r个产出, λj为线性组合系数, θ表示 被评价单 元的效率 值, 其取值范围为0< θ ≤1; 假设在T中取δ个DMU构成T的子集, 记做Tδ, 将Tδ中的DMU记为 (j=1,2,..., δ ); T 中剩余的DMU所构成的集合记做T/Tδ, 将T/Tδ中的DMU记为 然 后, 使用Tδ作为参考集评价T/Tδ中的DMU, 将Tδ和T/Tδ分别称为评价单 元集和被评价单 元集, 基于模型(1), 可 得模型(2)如下;权 利 要 求 书 1/4 页 2 CN 115526260 A 2在模型(2)中, 被评价单元为 用上角标的方式区分DMU所属的集合, 对 应的投入产出也以类似的方式进行区分; 注意到, 相 对于模型(1), 模型(2)中的θ取值范围 为θ >0当θ ≥1或无解时, 被评价单 元 相对于Tδ是优势单 元。 3.根据权利要求1中所述的一种基于大规模DEA快速求解算法的银行信用卡异常数据 识别方法, 其特 征在于, 所述的S3中大规模DEA快速求 解算法具体包括以下内容: S31: 在T中, 通过 FindSubset算法获取有效单 元的一个子集 初步构建部分前沿面; S32: 根据 通过模型(2)计算找到 中相对于 的所有优势单 元集合TS; S33: 令 通过模型(1)计算出TM中的所有有效单元集合TE, 最终完成T的 完整前沿面的构建与此同时, 得到TM中所有DMU的效率 值; S34: 根据TE, 通过模型(2)得到T\TM中DMU的效率 值。 4.根据权利要求3中所述的一种基于大规模DEA快速求解算法的银行信用卡异常数据 识别方法, 其特 征在于, 所述的S31中Fi ndSubset算法具体内容以如下伪代码进行描述:权 利 要 求 书 2/4 页 3 CN 115526260 A 3

PDF文档 专利 一种基于大规模DEA快速求解算法的银行信用卡异常数据识别方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于大规模DEA快速求解算法的银行信用卡异常数据识别方法 第 1 页 专利 一种基于大规模DEA快速求解算法的银行信用卡异常数据识别方法 第 2 页 专利 一种基于大规模DEA快速求解算法的银行信用卡异常数据识别方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:25:37上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。