转载 2020-01-12 19:09:00
679阅读
2评论
GSpan频繁子图挖掘算法,网上有很多相关的介绍,中文的一些资料总是似是而非,讲的不是很清楚(感觉都是互相抄来抄去,,,基本都是一个样,,,),仔细的研读了原论文后,在这里做一个总结。1. GSpan频繁子图挖掘算法:总的思想是,先生成频繁树,再在频繁树的基础上,生成频繁子图,满足最小支持度,满足最小DFS编码的所有频繁子图。GraphGen.输入:图集 GD,最小支持度阈值 min_sup;输出
目录1 基本概念2 算法分析2.1 算法设计的要求2.2 算法效率的度量——大O记法3 Python结构的性能3.1 列表3.2 字典 1 基本概念数据结构 相互之间存在一种或多种特定关系的数据元素的集合。通常有四类基本结构:集合、线性结构、树形结构、图状或网状结构。算法 对特性问题求解步骤的一种描述,是指令的有限序列。一个算法有下列五个重要特性:有穷性:执行步数有穷,执行时间有穷确定性:只有一
#coding=utf-8 import tree_builder import copy class Tree_miner(object): """tree_miner类. 作用:对Tree进行频繁项集的挖掘""" def __init__(self, Tree=None, min_sup=-1, headerTable={}): """tree_miner的初始化. Tree即为构造好的FP_