导读:本文带你用Python进行贡献度分析。贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律。
作者:张良均 谭立云 刘名军 江建明
同样的投入放在不同的地方会产生不同的效益。例如,对一个公司来讲,80%的利润常常来自于20%最畅销的产品,而其他80%的产品只产生了20%的利润。
就餐饮企业来讲,应用贡献度分析可以重点改善某菜系盈利最高的前80%的菜品,或者重点发展综合影响最高的80%的部门。这种结果可以通过帕累托图直观地呈现出来。图3-10是某个月中海鲜系列的10个菜品A1~A10的盈利额(已按照从大到小的顺序排序)。
图3-10 菜品盈利数据帕累托图
由图3-10可知,菜品A1~A7共7个菜品,占菜品种类数的70%,总盈利额占该月盈利额的85.0033%。根据帕累托法则,应该增加对菜品A1~A7的成本投入,减少对菜品A8~A10的成本投入,以获得更高的盈利额。
表3-5是餐饮系统对应的菜品盈利数据,绘制菜品盈利帕累托图,如代码清单3-8所示。
表3-5 餐饮系统菜品盈利数据
- 代码清单3-8 绘制菜品盈利数据帕累托图
# 菜品盈利数据帕累托图import pandas as pd# 初始化参数dish_profit = '../data/catering_dish_profit.xls'# 餐饮菜品盈利数据data = pd.read_excel(dish_profit, index_col='菜品名')data = data['盈利'].copy()data.sort_values(ascending=False)import matplotlib.pyplot as plt # 导入图像库plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号plt.figure()data.plot(kind='bar')plt.ylabel('盈利(元)')p = 1.0*data.cumsum()/data.sum()p.plot(color='r', secondary_y=True, style='-o',linewidth=2)plt.annotate(format(p[6], '.4%'), xy=(6, p[6]), xytext=(6*0.9, p[6]*0.9), arrow-props=dict(arrowstyle="->", connectionstyle="arc3,rad=.2")) # 添加注释,即85%处的标记。这里包括了指定箭头样式。plt.ylabel('盈利(比例)')plt.show()
关于作者:张良均,资深大数据挖掘与分析专家、模式识别专家、AI技术专家。有10余年大数据挖掘与分析经验,擅长Python、R、Hadoop、Matlab等技术实现的数据挖掘与分析,对机器学习等AI技术驱动的数据分析也有深入研究。