案例背景:

无人售货机是一种根据扫码支付(或投入钱币)而自动付货的机器,是商业自动化的常用设备,无人售货机不受时间、地点的限制,能节省人力、方便交易,是一种全新的商业零售方式,又被称为24小时营业的微型超市。无人售货机每天为客户提供便利的商品零售服务,同时也产生了大量的商品零售数据。然而,国内的无人售货机市场处于发展的初期阶段,没有达到规模化、秩序化的程度;一方面无人售货机多分布在经济发达的沿海地区;另一方面无人售货机贩卖的商品种类有限,不能满足用户的所有需求。为了最大化利用无人售货机资源,需要从业务场景出发,理解数据,分析并制定无人售货机项目的目标。

无人售货机客户订单的详情数据,记录着订单中的每种商品销售的数量、价格等数据。从商品销售的角度出发,分析商品的销售数据,计算各种商品的销售金额,以便了解商品的销售情况,分析哪些商品属于热销或滞销商品,为商品的销售提供更好的运营决策。

1.打开kettle,创建转换

无人售货使用RESNET还是YOLO 无人售货是什么_数据

2.配置CSV文件输入控件

创建CSV文件输入组件和获取数据。创建CSV文件输入组件,并命名为“CSV文件输入(订单)”,如图所示。设置组件参数,导入“order_details.csv”文件,并设置好字段参数。

无人售货使用RESNET还是YOLO 无人售货是什么_无人售货使用RESNET还是YOLO_02

3.配置过滤记录控件 

无人售货使用RESNET还是YOLO 无人售货是什么_数据_03

4.配置字段选择控件 

保留需要的字段,去除多余的字段。在【字段选择】组件中,设置参数,仅保留productname、amount、productpaytotalprice等字段,并分别改名为“商品名称”“product_number”“product_paytotalprice”,如图所示,丢弃其他与计算各商品销售金额无关的字段。

无人售货使用RESNET还是YOLO 无人售货是什么_控件_04

5.配置排序记录控件 

对商品名称进行排序。因为需要计算各商品的销售金额,所以必须对商品名称进行排序,在【排序记录】组件中,对商品名称字段按照升序进行排序。

无人售货使用RESNET还是YOLO 无人售货是什么_etl_05

6.配置分组控件 

对购买商品数量和商品实际支付总金额等字段进行聚合计算,统计各个商品的销售金额。在【分组】组件中,有关参数设置如图所示。

无人售货使用RESNET还是YOLO 无人售货是什么_字段_06

7.配置排序记录2控件 

在【排序记录2】组件中,设置商品销售金额字段按照降序排序。

无人售货使用RESNET还是YOLO 无人售货是什么_字段_07

8.配置Excel输出控件 

将经过排序的各商品销售金额数据输出并装载至Excel文件中。在【Excel输出(各商品销售金额)】组件中,设置参数,输出的Excel文件名为“无人售货机各商品销售金额.xls”,输出的字段参数如图所示。

无人售货使用RESNET还是YOLO 无人售货是什么_无人售货使用RESNET还是YOLO_08

9.运行转换 

无人售货使用RESNET还是YOLO 无人售货是什么_字段_09

 

无人售货使用RESNET还是YOLO 无人售货是什么_无人售货使用RESNET还是YOLO_10

在结果数据中,根据“商品名称”字段,对“商品实际支付总金额”“商品购买数量”字段数据,分组聚合统计到“商品销售金额”“商品销售数量”字段中,其中,“商品名称”为“脉动”的商品销售金额最多,在无人售货机上共成功销售2234件,商品销售金额为8907.99元。