本节内容:1:理解关联分析及专业名词2:关联分析指定数据结构-->transactions(事务结构)3:关联分析规则规定流程4:R代码实现规则 一、理解关联分析及专业名词1.1:什么是关联分析:有一个非常有名的故事:"尿布啤酒"。故事是这样的:美国的妇女们经常会嘱咐她们的丈夫 下班后为孩子买尿布,而丈夫在买完尿布后又要顺 手买回自己爱喝的啤酒,因此啤酒尿布在 一起被购买的机会
# Python与啤酒尿布的奇妙关联 在谈论数据分析的趣味性时,很难避开一个流行的案例:啤酒尿布的关系。这个案例最初是由数据分析师们在观察超市销售数据时发现的,认为男性顾客在购买啤酒时,往往也会顺带购买尿布。这样的关联不仅让人大开眼界,也为数据分析提供了丰富的启示。 ## 数据分析的背景 实际上,这种数据关系解释了消费者行为的某些方面,尤其是在购物的此起彼伏中。人们通常认为,啤酒尿布是呈
原创 1月前
5阅读
一、前提介绍:啤酒尿布:在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父 亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购 买啤酒,这样就会出现啤酒尿布这两件看上去不相干的商品经常会 出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一则他很有可能会放弃购物而到另一家商店,直到可以一 次同时买到啤酒尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤
# R语言中的尿布啤酒数据分析 ## 背景介绍 在数据分析领域,有一个著名的案例被称为“尿布啤酒数据”。这个案例源自于一家超市的销售数据,发现购买尿布的顾客也会购买啤酒,而这种关联性背后可能隐藏着一些商业价值。在本文中,我们将使用R语言对尿布啤酒数据进行分析,探索其中的关联规律。 ## 数据准备 首先,我们需要准备尿布啤酒数据集。这个数据集可以是一个简单的csv文件,包含了购买记录的信息。
原创 6月前
18阅读
这是一个很老但很有意思的故事我们去沃尔玛超市会发现一个很有趣的现象:货架上啤酒尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢?原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的啤酒(由此看出美国人爱喝酒)。商家通过对一年多的原始交易记录进行详细的分析,发现了这对神奇的组合。于是就毫不犹豫地将尿布啤酒摆放在一起售卖,通过它们的关联性,互相促进销售。“啤酒尿布”的故事一度是营销界的神话。那么问题来了,商家.
原创 2021-06-09 22:53:10
599阅读
这是一个很老但很有意思的故事我们去沃尔玛超市会发现一个很有趣的现象:货架上啤酒尿布竟然放在一起售卖,这看似两者毫不相关的东西,为什么会放在一起售卖呢?原来,在美国,妇女们经常会嘱咐她们的丈夫下班以后给孩子买一点尿布回来,而丈夫在买完尿布后,大都会顺手买回一瓶自己爱喝的啤酒(由此看出美国人爱喝酒)。商家通过对一年多的原始交易记录进行详细的分析,发现了这对神奇的组合。于是就毫不犹豫地将尿布啤酒摆放在一起售卖,通过它们的关联性,互相促进销售。“啤酒尿布”的故事一度是营销界的神话。那么问题来了,商家.
原创 2022-03-28 16:00:48
359阅读
# 如何实现“R语言啤酒尿布” ## 引言 作为一名经验丰富的开发者,我将教会你如何实现“R语言啤酒尿布”的问题。这个问题涉及到一个著名的市场分析案例,旨在展示数据分析中的有趣现象。 ## 整体流程 下面是整个过程的步骤: | 步骤 | 描述 | | --- | --- | | 步骤 1 | 数据获取 | | 步骤 2 | 数据清洗与准备 | | 步骤 3 | 数据分析 | | 步骤 4
原创 2023-07-22 12:50:19
55阅读
大数据”这一概念最初起源于美国。这里的“大”通常用来描述数据的三维特征:第一维指信息的数据体量日益庞大;第二维指信息的种类繁多;第三维指数据变为可用信息,并且可以分析速度越来越快。早在1969年,全球零售巨头沃尔玛便利用计算机对消费者的购物行为进行数据分析,结果发现男性顾客在购买婴儿尿布时,常常会顺便“搭配”几瓶啤酒来犒劳自己,于是推出了将啤酒尿布捆绑销售的促销手段。如今,这一“啤酒+尿布”的
转载 精选 2014-11-27 10:59:21
726阅读
数据仓库——在“啤酒尿布”中挖掘对话者:主持人:程鸿——《计算机世界》报记者专家:孟晓峰——中国人民大学信息学院教授祁国辉——“数据仓库之路”网站主持人IT厂商:杨顺生——NCR大中华区市场及合作伙伴总经理用户:陈道斌——工商银行信息管理部处长(博士)对话主题:数据仓库在中国的应用前景如何?  数据仓库的门槛有多高?主持人:自从“啤酒尿布”的故事在中
在用R语言做数据分析的时候,我们经常需要一些数据做实验,尤其当学会一个新的方法或者算法的时候,就想赶快编程实现一下。那么,问题来了,用什么数据好呢,什么样的数据适合做这种实验呢?好在R语言提供了很多的基本数据集,这些基本数据集是可以直接加载、可以完成几乎所有的数据分析任务模拟数据的。这都是些哪些种类的数据呢?这些基本数据集都在R包datasets里面,可以执行命令:> data(packag
关联分析概述啤酒尿布的故事,我估计大家都听过,这是数据挖掘里面最经典的案例之一。它分析的方法就关联分析。关联分析,顾名思义,就是研究不同商品之前的关系。这里就发现了啤酒尿布这两个看起来毫不相关的东西直接存在的微妙关系。最经典的关联分析算法之一就是Apriori算法,也是数据挖掘十大算法之一。在R中就有一个包可以做关联分析——arules和arulesViz,前者用于关联规则的数字化生成而后者是
原创 2018-01-12 19:35:02
9450阅读
数据分析的领域里,有一个非常经典的故事,这个故事常常被用来强调数据分析的价值。美国大型超市沃尔玛(Walmart),利用数据分析,发现每周五的晚上,啤酒尿布的销售量呈现正向关系。也就是每个周五的晚上时段,尿布啤酒这两样东西一起,卖得特别好。原因竟然是,年轻父亲会去超市帮婴儿买尿布,并且顺便买啤酒回家,以便周末在家看球赛。事实上,这个故事并不是真的。2002年,北爱荷华大学教授丹尼尔‧包尔(Daniel J. Power)对「啤酒尿布」的故事进行探源调查。他在同年七月,看了一部「欢庆啤酒尿布
原创 2021-06-09 22:53:11
1077阅读
# 如何使用R语言创建“尿布啤酒电子表格” ## 概述 在本文中,我将教你如何使用R语言创建一个简单的“尿布啤酒电子表格”。这个项目可以帮助你熟悉R语言的基本语法和数据处理功能。我们将使用R中的数据框来模拟一个小型销售数据,并通过电子表格的形式呈现出来。 ## 流程图 ```mermaid gantt title 创建“尿布啤酒电子表格”流程 section 创建数据
很遗憾,啤酒尿布在现实中不存在
转载 2021-09-07 14:35:33
366阅读
数据挖掘工具箱中,计量某个模式的频率是一项关键任务。在某些情况下,较频繁出现的模式可能最终成为更加重要的模式。如果我们可以发现经常同时出现的两个或者三个项目,就更为有趣了。在本文中,我们开始研究频繁项集,然后将其扩展为称作关联规则的一类模式。我们将介绍如下主题:什么是频繁项集?使用哪些技术找出频繁项集?瓶颈在哪里?如何加速这一过程?如何将频繁项集扩展为关联规则?什么是好的关联规则?我们将根据数据
原创 2021-03-27 09:00:06
185阅读
今天是机器学习专题的第19篇文章,我们来看经典的Apriori算法。Apriori算法号称是十大数据挖掘算法之一,在大数据时代威风无两,哪怕是没有听说过这个算法的人,对于那个著名的啤酒尿布的故事也耳熟能详。但遗憾的是,随着时代的演进,大数据这个概念很快被机器学习、深度学习以及人工智能取代。即使是拉拢投资人的创业者也很少会讲到这个故事了,虽然时代的变迁令人唏嘘,但是这并不妨碍它是一个优秀的算法。我
原创 2021-04-30 11:59:58
582阅读
# 机器学习啤酒数据集下载教程 ## 1. 整体流程 ```mermaid flowchart TD A[下载数据集] --> B[导入数据集] B --> C[数据预处理] C --> D[模型训练] D --> E[模型评估] ``` ## 2. 具体步骤和代码 ### 2.1 下载数据集 首先,你需要下载啤酒数据集。你可以使用以下代码从Kaggle上
今天是机器学习专题的第19篇文章,我们来看经典的Apriori算法。Apriori算法号称是十大数据挖掘算法之一,在大数据时代威风无两,哪怕是没有听说过这个算法的人,对于那个著名的啤酒尿布的故事也耳熟能详。但遗憾的是,随着时代的演进,大数据这个概念很快被机器学习、深度学习以及人工智能取代。即使是拉拢投资人的创业者也很少会讲到这个故事了,虽然时代的变迁令人唏嘘,但是这并不妨碍它是一个优秀的算法。我
原创 2020-12-04 21:55:25
257阅读
1点赞
啤酒每罐2.3元,饮料每罐1.9元。小明买了若干啤酒和饮料,一共花了82.3元。    我们还知道他买的啤酒比饮料的数量少,
原创 2022-11-01 11:14:25
35阅读
来自美食杰
转载 2023-02-22 08:37:02
70阅读
  • 1
  • 2
  • 3
  • 4
  • 5