(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210590925.0 (22)申请日 2022.05.27 (71)申请人 天翼电子商务有限公司 地址 100037 北京市西城区阜成门外大街 31号4层429D (72)发明人 柳佳浩 徐德华 汤敏伟 李真  (51)Int.Cl. G06F 16/23(2019.01) G06F 16/2455(2019.01) G06F 16/901(2019.01) (54)发明名称 一种基于外置缓存的图谱群组实时更新方 法 (57)摘要 本发明公开了一种基于外置缓存的图谱群 组实时更新方法, 包括以下步骤: S1: 获取数据预 处理, 抽取构图的实体和关系, 构建知识图谱; S2: 对构建好的图谱, 利用连通子图算法进行群 组划分; S3: 利用外置缓存的方法进行连通子图 实时数据更新; S4: 查询实时更新的外置缓存及 连通子图群组。 本发明可以有效地降低图谱本身 的计算压力, 提升计算效率, 使得实时社群更新 成为了可能; 在群组计算过程中, 开拓性的使用 了外部缓存的集合计算, 从而避免了图谱重新划 分群组的步骤, 提升了群组系统的运行效率; 群 组的保存采用了外置缓存+内部图谱存储的方 式, 外部缓存可插拔的形式的耦合性更低, 提升 了群组系统的鲁棒 性。 权利要求书1页 说明书6页 附图2页 CN 115391357 A 2022.11.25 CN 115391357 A 1.一种基于 外置缓存的图谱群组实时更新方法, 其特 征在于, 包括以下步骤: S1: 获取数据预处 理, 抽取构图的实体和关系, 构建知识图谱; S2: 对构建好的图谱, 利用连通子图算法进行群组划分; S3: 利用外 置缓存的方法进行 连通子图实时数据更新; S4: 查询实时更新的外 置缓存及连通子图群组。 2.根据权利要求1所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所 述步骤S1, 包 含: S1.1: 从业务数据表中获取原始交易数据和 操作数据, 进行数据清洗等预处理工作, 抽 取构图所需的实体和关系信息; S1.2: 根据步骤S1.1中抽取的实体和关系, 将数据导入图数据库Neo4j构建图谱, 或使 用Networkx等构图工具构图, 当数据量较大时Neo 4j的性能明显优于Netw orkx。 3.根据权利要求2所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所 述步骤S2, 包 含: S2.1: 基于步骤S1.2中构 建的图谱, 采用连通子图算法在全图上进行子图划分, 形成一 个个彼此之间互相割裂, 但内部联系紧密的群组; S2.2: 将群组信息更新至redis/mysql 这类外置存储装置中用于缓存群组信息 。 4.根据权利要求3所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所 述步骤S3, 包 含: S3.1: 根据 步骤S2.1划分的用户群组, 查询图谱信息和S2.2存储在外置缓存中的信息, 定位到需要新增的实体所在的群组; S3.2: 基于步骤S3.1定位到的群组, 更新外 置存储装置中用于缓存群组信息; S3.3: 基于步骤S3.1和步骤S3.2中得到 的实体所在的群组以及缓存信息, 将实体更新 到图谱内, 并赋予群组信息 。 5.根据权利要求1所述的一种基于外置缓存的图谱群组实时更新方法, 其特征在于, 所 述步骤S4, 包 含: S4.1: 根据所需查询群组信息, 查询外 置存储装置中该群组的状态; S4.2: 基于步骤S4.1的查询到的群组状态, 进入图数据库/其他构图方式构造的图谱查 询该群组详情并输出。权 利 要 求 书 1/1 页 2 CN 115391357 A 2一种基于外置缓存的图谱群组实时更新 方法 技术领域 [0001]本发明涉及电子信息技术领域, 特别涉及一种基于外置缓存的图谱群组  实时更 新方法。 背景技术 [0002]随着社会的高速发展, 互联 网技术飞跃性的突破, 知识图谱这一概念逐  渐出现于 公众视野中, 在知识图谱各大应用场景中, 尤以社群分析广泛的被  应用于金融、 电商等行 业的风险控制、 风险管理中。 目前的社群分析受限于  现存图数据库的技术限制, 在OLAP (On‑Line Analytical  Processing,联机  分析处理)场景下能够得以应用, 但是在OLTP (on‑line transaction processing, 联机事务处理)场景下难以得到应用。 其主要原因为 OLTP场景  涉及到数据更新和查询的时效性要求, 如果存在社群的更新, 那么在目前图  数 据库的存储性能和计算性能的 限制下, 无法实现实时更新和查询的效果。  而本方法系通过 添加使用外置缓存的方法, 解决了图谱性能不 足导致的社群  无法实时更新的问题, 从而进 一步解决了图谱社群实时查询的问题, 推动了  知识图谱在社群分析中的应用。 发明内容 [0003]本发明要解决的技术问题是克服现有技术的缺陷, 提供一种基于外置缓  存的图 谱群组实时更新方法, 解决了社群 计算在实时场景 下的运行效率问题。 [0004]本发明提供了如下的技 术方案: [0005]本发明提供一种基于 外置缓存的图谱群组实时更新方法, 包括以下步骤: [0006]S1: 获取数据预处 理, 抽取构图的实体和关系, 构建知识图谱; [0007]S2: 对构建好的图谱, 利用连通子图算法进行群组划分; [0008]S3: 利用外 置缓存的方法进行 连通子图实时数据更新; [0009]S4: 查询实时更新的外 置缓存及连通子图群组。 [0010]作为本发明的一种优选技 术方案, 所述 步骤S1, 包 含: [0011]S1.1: 从业务数据表中获取原始交易数据和操作数据, 进行数据清洗等  预处理工 作, 抽取构图所需的实体和关系信息; [0012]S1.2: 根据步骤S1.1中抽取的实体和关系, 将数据导入图数据库Neo4j  构建图谱, 或使用Netw orkx等构图工具构图, 当数据量较大时Neo 4j的性能 明显优于Netw orkx。 [0013]作为本发明的一种优选技 术方案, 所述 步骤S2, 包 含: [0014]S2.1: 基于步骤S1.2中构建的图谱, 采用连通子图算法在全图上进行子  图划分, 形成一个 个彼此之间互相割裂, 但内部联系紧密的群组; [0015]S2.2: 将群组信息更新至redis/mysql 这类外置存储装置中用于缓存群  组信息。 [0016]作为本发明的一种优选技 术方案, 所述 步骤S3, 包 含: [0017]S3.1: 根据步骤S2.1划分的用户群组, 查询图谱信息和S2.2存储在 外 置缓存中的 信息, 定位到需要新增的实体所在的群组;说 明 书 1/6 页 3 CN 115391357 A 3

PDF文档 专利 一种基于外置缓存的图谱群组实时更新方法

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种基于外置缓存的图谱群组实时更新方法 第 1 页 专利 一种基于外置缓存的图谱群组实时更新方法 第 2 页 专利 一种基于外置缓存的图谱群组实时更新方法 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:46:24上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。