(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211211389.5
(22)申请日 2022.09.30
(71)申请人 合肥工业大 学
地址 230009 安徽省合肥市包河区屯溪路
193号
(72)发明人 冯晨鹏 常圣卿 丁晶晶 郝泽林
(74)专利代理 机构 武汉菲翔 知识产权代理有限
公司 42284
专利代理师 梁燕飞
(51)Int.Cl.
G06K 9/62(2022.01)
G06Q 10/06(2012.01)
G06Q 40/02(2012.01)
(54)发明名称
一种基于大规模DEA快速求解算法的银行信
用卡异常数据识别方法
(57)摘要
本发明公开了一种基于大规模DEA快速求解
算法的银行信用卡异常数据 识别方法, 该基于大
规模DEA快速求解算法的银行信用卡异常数据 识
别方法, 通过DEA方法识别海量信用卡数据点之
中的“异常值”基于DEA方法来识别异常值点, 有
其特有的优势, 因为每个数据点往往包含多个属
性值, 但当数据点的所有属性值组合起来, 则有
可能是异常点, DEA方法可以很好地识别这种情
况然而, 信用卡数据点往往存在数据量大、 多属
性、 快速分析、 快速响应等特点, 在利用DEA进行
异常数据识别时, 会出现无法计算或者计算时间
过长的挑战, 本发明提出一种大规模DEA快速求
解算法, 用以及时识别大规模 银行信用卡数据的
异常情况, 从而帮助银行对信用卡用户审计、 评
估。
权利要求书4页 说明书9页
CN 115526260 A
2022.12.27
CN 115526260 A
1.本发明提供一种基于大规模DEA快速求解算法的银行信用卡异常数据识别方法, 其
特征在于, 包括以下步骤:
S1: 确定决策单元(D ecision‑Making Unit, DMU), 选取一定时间内, 银行产生的信用卡
数据, 假设有n个用户数据, 将其视为 n个决策单元(DMUj(j=1,2,. ...n));
S2: 选择信用卡数据中的关键属性包括所选时间段内的薪酬水平、 个人资产、 个人负
债、 交易频率、 交易金额、 大宗消费数量, 根据不同情况, 选择不同指标作为投入产出指标,
记有m个投入指标和s个产出指标, 并由n个DMU的投入产出 数据组成基础数据集, 记为T;
S3: 通过大规模DEA快速求解算法快速分析上述信用 卡数据集T, 求得每个DMU的效率
值;
S4: 设定阈值, 将DEA效率 值大于等于 0.99的DMU识别为异常DMU, 找出异常DMU;
S5: 分析被判定为异常DMU的用户, 判断异常原因, 处 理信用卡方面的对应问题。
2.根据权利要求1中所述的一种基于大规模DEA快速求解算法的银行信用卡异常数据
识别方法, 其特 征在于, 所 涉及到的DEA基础内容包括:
DEA‑BCC投入导向模型的包络形式如模型(1)所示:
在模型(1)中, 被评价单元为DMUk, 其中k=1,2,...,n, xik(i=1,2,...,m)为被评价单
元的第i个投入, yrk(r=1,2,...,s)为被评价单元的第r个产出, λj为线性组合系数, θ表示
被评价单 元的效率 值, 其取值范围为0< θ ≤1;
假设在T中取δ个DMU构成T的子集, 记做Tδ, 将Tδ中的DMU记为
(j=1,2,..., δ ); T
中剩余的DMU所构成的集合记做T/Tδ, 将T/Tδ中的DMU记为
然
后, 使用Tδ作为参考集评价T/Tδ中的DMU, 将Tδ和T/Tδ分别称为评价单 元集和被评价单 元集,
基于模型(1), 可 得模型(2)如下;权 利 要 求 书 1/4 页
2
CN 115526260 A
2在模型(2)中, 被评价单元为
用上角标的方式区分DMU所属的集合, 对
应的投入产出也以类似的方式进行区分; 注意到, 相 对于模型(1), 模型(2)中的θ取值范围
为θ >0当θ ≥1或无解时, 被评价单 元
相对于Tδ是优势单 元。
3.根据权利要求1中所述的一种基于大规模DEA快速求解算法的银行信用卡异常数据
识别方法, 其特 征在于, 所述的S3中大规模DEA快速求 解算法具体包括以下内容:
S31: 在T中, 通过 FindSubset算法获取有效单 元的一个子集
初步构建部分前沿面;
S32: 根据
通过模型(2)计算找到
中相对于
的所有优势单 元集合TS;
S33: 令
通过模型(1)计算出TM中的所有有效单元集合TE, 最终完成T的
完整前沿面的构建与此同时, 得到TM中所有DMU的效率 值;
S34: 根据TE, 通过模型(2)得到T\TM中DMU的效率 值。
4.根据权利要求3中所述的一种基于大规模DEA快速求解算法的银行信用卡异常数据
识别方法, 其特 征在于, 所述的S31中Fi ndSubset算法具体内容以如下伪代码进行描述:权 利 要 求 书 2/4 页
3
CN 115526260 A
3
专利 一种基于大规模DEA快速求解算法的银行信用卡异常数据识别方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:25:37上传分享