GSpan频繁子图挖掘算法,网上有很多相关的介绍,中文的一些资料总是似是而非,讲的不是很清楚(感觉都是互相抄来抄去,,,基本都是一个样,,,),仔细的研读了原论文后,在这里做一个总结。1. GSpan频繁子图挖掘算法:总的思想是,先生成频繁树,再在频繁树的基础上,生成频繁子图,满足最小支持度,满足最小DFS编码的所有频繁子图。GraphGen.输入:图集 GD,最小支持度阈值 min_sup;输出
转载
2023-11-01 15:39:12
373阅读
目录1 基本概念2 算法分析2.1 算法设计的要求2.2 算法效率的度量——大O记法3 Python结构的性能3.1 列表3.2 字典 1 基本概念数据结构 相互之间存在一种或多种特定关系的数据元素的集合。通常有四类基本结构:集合、线性结构、树形结构、图状或网状结构。算法 对特性问题求解步骤的一种描述,是指令的有限序列。一个算法有下列五个重要特性:有穷性:执行步数有穷,执行时间有穷确定性:只有一
转载
2023-09-20 06:59:50
87阅读
#coding=utf-8
import tree_builder
import copy
class Tree_miner(object):
"""tree_miner类. 作用:对Tree进行频繁项集的挖掘"""
def __init__(self, Tree=None, min_sup=-1, headerTable={}):
"""tree_miner的初始化. Tree即为构造好的FP_
转载
2024-03-07 14:27:37
43阅读