
频繁子图 大规模图集 ADI 存储结构 最小DFS编码 重复扫描.doc
3页频繁子图论文:大规模图集的频繁子图挖掘算法研究【中文摘要】频繁子图挖掘是指从图集获得频繁出现的子图模式,它挖掘得到的结果可用于对图集的分类和聚类研究,有助于用户了解图集的特征目前的频繁子图挖掘算法大都是基于内存的,实际上很多大规模图集无法被全部调入内存,针对这种情况,目前的解决方法是将大规模图集划分为多个可调入内存的子图集模块,分别对各个子图集模块进行频繁子图挖掘,但这种方法存在扩展频繁子图时产生冗余子图、重复扫描图集等问题为了解决这些问题,本文重点研究了一种高效的频繁子图挖掘算法,并将它应用于大规模图集的挖掘首先,针对 gSpan 算法所存在的扩展频繁子图时产生冗余的问题,提出一种改进的算法 CSGM,结合 ADI++存储结构,提高算法处理图集的规模,并且在扩展频繁边时,可以快速得到相关邻接边的信息,提高了扩展频繁边的效率,同时还提出了三种有效的删除非最小 DFS 编码的方法,保证算法在扩展频繁子图时每一次均可以生成图的最小 DFS 编码,避免对非最小 DFS 编码的支持度计算,减少了算法的计算量。
其次,针对现有的大规模图集的频繁子图挖掘算法 PartGraphMining 存在的重复扫描图集问题,提出了一种改进的算法 IPGM通过使用本文提出的 CSGM 算法对分割后...【英文摘要】The frequent subgraph mining is a technology of obtaining frequent subgraph patterns from graph databases, the result can be used in the classification and clustering research of the graph databases. It is useful for client to study the feature of graph sets and build search index of graph databases.At present, the existing graph mining algorithms typically assume that the graph databases can fit into main memory. As many large graph databases cannot satisfy this condition, when faced with this situation,th...【关键词】频繁子图 大规模图集 ADI 存储结构 最小 DFS 编码 重复扫描【英文关键词】Frequent subgraph large graph databases ADI storage structure Minimum DFS code Repeat scan【索购全文】联系 Q1:138113721 Q2:139938848【目录】大规模图集的频繁子图挖掘算法研究 摘要 5-6 Abstract 6-7 第 1 章 绪论 10-16 1.1 研究背景 10-11 1.2 研究现状 11-14 1.3 研究意义 14 1.4 研究内容 14-15 1.5 本文结构 15-16 第 2 章 基础知识概述 16-26 2.1 引言 16 2.2 图的基本定义 16-19 2.3 大规模图集的频繁子图挖掘算法类型 19-20 2.4 频繁子图挖掘算法介绍 20-24 2.4.1 gSpan 算法 20-23 2.4.2 PartGraphMining 算法 23-24 2.5 图挖掘的主要问题 24-25 2.6 本章小结 25-26 第 3 章 基于标准编码的频繁子图挖掘算法 26-40 3.1 引言 26 3.2 图的存储结构 26-28 3.3 gSpan 算法的缺点 28 3.4 CSGM 算法 28-38 3.4.1 构建 ADI++存储结构 29-32 3.4.2 删除非标准编码 32-36 3.4.3 算法设计 36-38 3.4.4算法分析 38 3.5 本章小结 38-40 第4 章 基于 CSGM 的大规模图集挖掘 40-50 4.1 引言 40 4.2 PartGraphMining 算法缺点 40-41 4.3 IPGM 算法 41-48 4.3.1 分割图集 41-43 4.3.2 构建 Hash 表 43-47 4.3.3 算法设计 47-48 4.3.4 算法分析 48 4.4 本章小结 48-50 第 5 章 实验及结果分析 50-62 5.1 引言 50 5.2 CSGM 算法的实现与分析 50-56 5.2.1 实验设置及开发工具 50 5.2.2 实际的数据集 50-53 5.2.3 模拟的数据集 53-56 5.3 IPGM 算法的实现与分析 56-60 5.3.1 实验设置及开发工具 56 5.3.2 数据集 56-60 5.4 本章小结 60-62 结论 62-64 参考文献 64-69 攻读硕士学位期间承担的科研任务与主要成果 69-70 致谢 70-71 作者简介 71 。












