(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210590925.0
(22)申请日 2022.05.27
(71)申请人 天翼电子商务有限公司
地址 100037 北京市西城区阜成门外大街
31号4层429D
(72)发明人 柳佳浩 徐德华 汤敏伟 李真
(51)Int.Cl.
G06F 16/23(2019.01)
G06F 16/2455(2019.01)
G06F 16/901(2019.01)
(54)发明名称
一种基于外置缓存的图谱群组实时更新方
法
(57)摘要
本发明公开了一种基于外置缓存的图谱群
组实时更新方法, 包括以下步骤: S1: 获取数据预
处理, 抽取构图的实体和关系, 构建知识图谱;
S2: 对构建好的图谱, 利用连通子图算法进行群
组划分; S3: 利用外置缓存的方法进行连通子图
实时数据更新; S4: 查询实时更新的外置缓存及
连通子图群组。 本发明可以有效地降低图谱本身
的计算压力, 提升计算效率, 使得实时社群更新
成为了可能; 在群组计算过程中, 开拓性的使用
了外部缓存的集合计算, 从而避免了图谱重新划
分群组的步骤, 提升了群组系统的运行效率; 群
组的保存采用了外置缓存+内部图谱存储的方
式, 外部缓存可插拔的形式的耦合性更低, 提升
了群组系统的鲁棒 性。
权利要求书1页 说明书6页 附图2页
CN 115391357 A
2022.11.25
CN 115391357 A
1.一种基于 外置缓存的图谱群组实时更新方法, 其特 征在于, 包括以下步骤:
S1: 获取数据预处 理, 抽取构图的实体和关系, 构建知识图谱;
S2: 对构建好的图谱, 利用连通子图算法进行群组划分;
S3: 利用外 置缓存的方法进行 连通子图实时数据更新;
S4: 查询实时更新的外 置缓存及连通子图群组。
2.根据权利要求1所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所
述步骤S1, 包 含:
S1.1: 从业务数据表中获取原始交易数据和 操作数据, 进行数据清洗等预处理工作, 抽
取构图所需的实体和关系信息;
S1.2: 根据步骤S1.1中抽取的实体和关系, 将数据导入图数据库Neo4j构建图谱, 或使
用Networkx等构图工具构图, 当数据量较大时Neo 4j的性能明显优于Netw orkx。
3.根据权利要求2所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所
述步骤S2, 包 含:
S2.1: 基于步骤S1.2中构 建的图谱, 采用连通子图算法在全图上进行子图划分, 形成一
个个彼此之间互相割裂, 但内部联系紧密的群组;
S2.2: 将群组信息更新至redis/mysql 这类外置存储装置中用于缓存群组信息 。
4.根据权利要求3所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所
述步骤S3, 包 含:
S3.1: 根据 步骤S2.1划分的用户群组, 查询图谱信息和S2.2存储在外置缓存中的信息,
定位到需要新增的实体所在的群组;
S3.2: 基于步骤S3.1定位到的群组, 更新外 置存储装置中用于缓存群组信息;
S3.3: 基于步骤S3.1和步骤S3.2中得到 的实体所在的群组以及缓存信息, 将实体更新
到图谱内, 并赋予群组信息 。
5.根据权利要求1所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所
述步骤S4, 包 含:
S4.1: 根据所需查询群组信息, 查询外 置存储装置中该群组的状态;
S4.2: 基于步骤S4.1的查询到的群组状态, 进入图数据库/其他构图方式构造的图谱查
询该群组详情并输出。权 利 要 求 书 1/1 页
2
CN 115391357 A
2一种基于外置缓存的图谱群组实时更新 方法
技术领域
[0001]本发明涉及电子信息技术领域, 特别涉及一种基于外置缓存的图谱群组 实时更
新方法。
背景技术
[0002]随着社会的高速发展, 互联 网技术飞跃性的突破, 知识图谱这一概念逐 渐出现于
公众视野中, 在知识图谱各大应用场景中, 尤以社群分析广泛的被 应用于金融、 电商等行
业的风险控制、 风险管理中。 目前的社群分析受限于 现存图数据库的技术限制, 在OLAP
(On‑Line Analytical Processing,联机 分析处理)场景下能够得以应用, 但是在OLTP
(on‑line transaction processing, 联机事务处理)场景下难以得到应用。 其主要原因为
OLTP场景 涉及到数据更新和查询的时效性要求, 如果存在社群的更新, 那么在目前图 数
据库的存储性能和计算性能的 限制下, 无法实现实时更新和查询的效果。 而本方法系通过
添加使用外置缓存的方法, 解决了图谱性能不 足导致的社群 无法实时更新的问题, 从而进
一步解决了图谱社群实时查询的问题, 推动了 知识图谱在社群分析中的应用。
发明内容
[0003]本发明要解决的技术问题是克服现有技术的缺陷, 提供一种基于外置缓 存的图
谱群组实时更新方法, 解决了社群 计算在实时场景 下的运行效率问题。
[0004]本发明提供了如下的技 术方案:
[0005]本发明提供一种基于 外置缓存的图谱群组实时更新方法, 包括以下步骤:
[0006]S1: 获取数据预处 理, 抽取构图的实体和关系, 构建知识图谱;
[0007]S2: 对构建好的图谱, 利用连通子图算法进行群组划分;
[0008]S3: 利用外 置缓存的方法进行 连通子图实时数据更新;
[0009]S4: 查询实时更新的外 置缓存及连通子图群组。
[0010]作为本发明的一种优选技 术方案, 所述 步骤S1, 包 含:
[0011]S1.1: 从业务数据表中获取原始交易数据和操作数据, 进行数据清洗等 预处理工
作, 抽取构图所需的实体和关系信息;
[0012]S1.2: 根据步骤S1.1中抽取的实体和关系, 将数据导入图数据库Neo4j 构建图谱,
或使用Netw orkx等构图工具构图, 当数据量较大时Neo 4j的性能 明显优于Netw orkx。
[0013]作为本发明的一种优选技 术方案, 所述 步骤S2, 包 含:
[0014]S2.1: 基于步骤S1.2中构建的图谱, 采用连通子图算法在全图上进行子 图划分,
形成一个 个彼此之间互相割裂, 但内部联系紧密的群组;
[0015]S2.2: 将群组信息更新至redis/mysql 这类外置存储装置中用于缓存群 组信息。
[0016]作为本发明的一种优选技 术方案, 所述 步骤S3, 包 含:
[0017]S3.1: 根据步骤S2.1划分的用户群组, 查询图谱信息和S2.2存储在 外 置缓存中的
信息, 定位到需要新增的实体所在的群组;说 明 书 1/6 页
3
CN 115391357 A
3
专利 一种基于外置缓存的图谱群组实时更新方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:46:24上传分享