题目 B:餐饮服务评价情感倾向分析 完整解题
餐饮行业被誉为“永不落幕的黄金行业”,一方面是其“民以食 为天”的刚需特性,另一方面是较低的创业门槛,使得行业竞争激烈。 中国餐饮市场经过迅速发展,产业链逐步完善,餐饮外卖市场逐步成 熟,在网络和疫情的影响下,年轻人的线上消费倾向进一步养成,很 大程度上也助推了餐饮行业的线上发展。对餐饮企业来说,结合线上 线下精细化运营,把握好用户评价,才能在竞争中脱颖而出。本题采 集了不同餐饮企业的餐品评论数据,请根据提供的数据进行数据的清 洗、分析与挖掘,并回答下列问题。
2.1 第一问
对数据中的评价内容进行分析,制作词云图,分别给出积极 情绪、消极情绪评价次数最多的 10 个词。
对数据中的评价内容进行分析,制作词云图,分别给出积极 情绪、消极情绪评价次数最多的 10 个词。
题目分析:首先先根据消极跟积极进行分组,对文本进行分词,可以采用结巴分词器,然后各自统计出消极跟积极评价词语出现次数最多的十个词
2.2. 第二问
分析数据中用户评价的积极情绪、消极情绪与评价时间是否 存在关系,请说明理由。
题目分析:时间数据需要处理一下,可以处理出月,日,小时,三个分组,然后对时间进行分组,统计出这三个时频的消极跟积极情绪的文本个数,然后采用方差分析进行差异性分析
2.3. 第三问
积极情绪最多的是哪个商家,并总结这个商家的优点有哪些。
题目分析:对商家进行分组,统计出积极情绪的文本个数,然后进行降序排序得到积极情绪最多的那个商家,可以对其文本进行lda主题词分析,挖掘其用户反馈的优点。
2.4. 第四问
消极情绪最多的是哪个商家,并提出相关改进策略,提高顾 客的积极情绪。
题目分析:对商家进行分组,统计出消极情绪的文本个数,然后进行降序排序得到消极情绪最多的那个商家,可以对其文本进行lda主题词分析,挖掘其用户反馈的缺点,然后对症下药
2.5. 第五问
建立餐饮服务评论的情感倾向模型,并对模型的性能和误差 进行评估。基于模型对附件中的测试数据 test.xlsx 进行评测,将评 测结果补充到第一列中,并将此文件一起上传到竞赛平台。
题目分析:搞个文本分类模型即可,需要训练词向量,建议使用机器学习,针对这种二分类的短文本分类有奇效。
完整解题视频思路已经发放