大数据概论
作业(一)信息技术的不断发展让人们离不开科技,我们每天使用各类电子产品所产生的信息数据不计其数,而这些数据的合理利用将会使我们的生活更加的便捷,所以,大数据俨然已成为现在前沿科技。的研究热点,大数据来源于我们生活的方方面面,也必将影响着我们生活的各个方面。
将大数据和商业进行有效结合无疑将对商业运营产生巨大影响,利用人们的生活数据,合理推出新的产品和改善推销模式,十分有利于商业的发展。所以,现在我们根据数据集(sakila),设计一种数据分析(或者数据挖掘的方法),发现:最具有购买潜力的顾客,并给他们发送感谢邮件。已吸引潜力顾客
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产
数据来源:老师给的sakila压缩包
数据分析工具:MYSQL
分析步骤:
1、打开MYSQL,建立连接;
2.导入.cvs数据文件

3.建立查询,将customer表格中 活跃度为0的客户排除潜在力,并删除信息(电脑非正常关机截图找不到了)

4.在payment数据表格中将各个客户的付款总金额求和并按降序排序,筛选出前50名作为潜在客户
- SELECT
customer_id,
SUM(amount) Sumamount
FROM
payment
GROUP BY
customer_id
ORDER BY
Sumamount DESC
LIMIT 50
5.在payment数据表格中查找客户建立资料的次数,以看出该客户对产品的需求和热爱程度,按照次数降序,选出前50作为潜在客户
SELECT
customer_id,
COUNT(*) as COUNT
FROM
payment
GROUP BY
customer_id
ORDER BY
COUNT DESC
LIMIT 50
6.将4和5的客户ID进行对比,选出最具有潜力的客户
SELECT
a.customer_id,
a.count,
b.Sumamount
FROM
count a,
sumamount b
WHERE
a.customer_id = b.customer_id

7.将6中客户id在customer数据表格中找出,并依据客户信息给客户发送感谢信息
SELECT
a.*
FROM
id b,
customer a
WHERE
a.customer_id = b.customer_id

分析总结:
依据所给数据,分析customer和payment两个表格内的数据。从payment数据表格中客户租赁产品的次数和总的花费中各自的前五十生成新的表格导出。再将表格count和sumamount导入mysql,进行第二次筛选。我们认为购买次数相对较高并且消费金额较大的客户是最具有购买潜力的客户。
根据所找到的最具有消费潜力的客户ID,对应在customer表格中找到客户信息,依据客户所留下的信息给客户发送感谢邮件。
















