apriori关联规则算法python apriori关联规则算法流程图

转载

mob64ca14092155 2023-08-24 20:43:51

文章标签 apriori关联规则算法python 算法关联规则频繁项集数据集 文章分类 Python 后端开发

实验目的:

1、理解关联规则中Apriori算法实现原理

2、掌握项集和频繁项集的定义。

3．掌握如何从低阶频繁项生成高阶候选项。

4．掌握如何进行连接和剪枝。

5．掌握如何利用频繁项生成所有的强关联规则

实验环境:

Anaconda

实验内容及过程:

关联规则发现是数据挖掘中重要的算法之一，有许多版本变种和应用场景。关联规则发现算法的基础算法之一是Apriori算法，要求针对某种格式数据和给定的阈值，代码实现Apriori算法，最终能够产生所有的强关联规则。其中数据格式不限，数据源任选。

步骤一:选取数据集(图1)，代码如图2，设定最小支持度s和最小置信度c;

步骤二:获取数据集（图3），并获取数据集中的的子集，利用最小支持数选出满足的子集。(图4)

apriori关联规则算法python apriori关联规则算法流程图_算法

apriori关联规则算法python apriori关联规则算法流程图_算法_02

图1 图2

apriori关联规则算法python apriori关联规则算法流程图_算法_03

图3

apriori关联规则算法python apriori关联规则算法流程图_数据集_04

图4

步骤三：根据频繁(k-1)项集自身连接产生候选K项集Ck，并剪去不符合条件的候选。（图5）

步骤四：根据数据集获取频繁项集。（图6）

步骤五：定义获取关联规则（图7）

apriori关联规则算法python apriori关联规则算法流程图_apriori关联规则算法python_05

图5

apriori关联规则算法python apriori关联规则算法流程图_频繁项集_06

图6

apriori关联规则算法python apriori关联规则算法流程图_数据集_07

图7

由于规则是由频繁项集产生，因此每个规则都自动地满足最小支持度。频繁项集和它们的最小支持度可以预先存放在散列表中。

apriori关联规则算法python apriori关联规则算法流程图_算法_08

结果展示

实验心得：

通过这次的实验我明白，Apriori关联规则挖掘一般可分成两个步骤：第一步找出所有支持度大于等于最小支持度阈值的频繁项集。第二步由频繁模式生成满足可信度阈值的关联规则。

那什么时候算法结束呢？细看代码，我们可以发现如果⾃连接得到的已经不再是频繁集，那么取最后⼀次得到的频繁集作为结果。

需要值得注意的是：Apriori算法为了进⼀步缩⼩需要计算⽀持度的候选集⼤⼩，减⼩计算量，所以在取得候选集时就进⾏了它的⼦集必须也是频繁集的判断。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：java jar 如何导入 java导入jar包的方式

下一篇：mysql 连接字符串超时时间 mysql连接设置字符编码

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

apriori关联规则算法python apriori关联规则算法流程图

apriori关联规则算法python apriori关联规则算法流程图

51CTO博客