随着社会的发展,人们的消费水平越来越高,大学生也一样有了更多的消费模式,而我希望通过调查大学生消费状况来发现大学生消费的大体趋势与关联。

因为很多大学生到月末就发现钱不够,但又不知道钱花在什么地方,从而贷款借钱。所以我打算从学生是否参加社团情况和消费状况来调查,而发现参加社团的人是消费水平高些还是低些,从而得出参加社团是否让学生减少消费,减少的原因又是什么,是没时间去上网、购物,还是别的原因。从而知道大学生消费受那些因素影响,看社团活动是否对大学生的正确消费观有积极作用。

通过收集大学生在校消费状况和社团参与情况,发现大学生消费关联情况。看大学生消费是否受参加社团的印象,参加社团的人消费哪些支出高,不参加又有哪些支出高,游戏支出、食物支出、手机话费支出、旅游支出等,从而知道社团会减少哪些支出又增加哪些支出,大家每月是否有剩余,剩余又占多少。得出社团活动对大学生的消费观有好的影响还是坏的。

方案步骤:

第一步:制作调查问卷,在校内收集数据源

第二步:定义数据源视图。在此我们要建立好数据挖掘中事例表和嵌套表,并定义两者之间的关系,定义User为事例表(Case Table),Sales为嵌套表(Nested Table)。

第三步:选取Microsoft Association Rules(关联规则)算法,建立挖掘模型。

第四步、设置算法参数,部署挖掘模型。

第五步、浏览察看挖掘模型。对于关联规则算法来说,三个查看的选项卡。

A:项集:“项集”选项卡显示被模型识别为经常发现一起出现的项集的列表。在这里指的是经过关联规则算法处理后,发现关联在一起的消费内形集合。

B:规则:“规则”选项卡显示关联算法发现的规则。“规则”选项卡包含一个具有以下列的网格:“概率”、“重要性”和“规则”。概率说明出现规则结果的可能性。重要性用于度量规则的用途。尽管规则出现的概率可能很高,但规则自身的用途可能并不重要。重要性列就是说明这一情况的。例如,如果每个项集都包含属性的某个特定状态,那么,即使概率非常高,预测状态的规则也并不重要。重要性越高,规则越重要。

C:关联网络:节点间的箭头代表项之间有关联。箭头的方向表示按照算法发现的规则确定的项之间的关联。

关键问题:数据挖掘中Apriori algorithm(关联规则)算法的学习,相关统计软件的使用方法和调查问卷的发放与收回。