【导语】之前的一篇文章中,作者为大家用 Python 爬取了近 14 年所有的福彩 3D 信息,有了这些信息,我们要是否可以找到中奖规律,增加中奖概率呢?本期内容,作者就将带领大家一起探索这些诱人的奖金背后的秘密!
今天就满足大家的要求,对 2005-2018 年期间,14 年双色球数据进行分析可视化,看看能否找到一些规律可循(在我看来,彩票规律就是没有规律)。
不过,通过此案例,你可以学习到如何使用 matplotlib 画直方图、气泡图以及更好看的气泡图;同时也能明白一些道理,如:为什么穷人更爱买彩票?
其实,每期的奖金总数是固定的,让两个人分,还是十个人分,都是一样的!如果说每一期一等奖奖金都是一千万,有作弊的意义,抽个被买的最少的组合!
但为什么每期双色球一等奖奖金不是固定的呢!就是因为其奖金机制,双色球当期销售额的51%作为当期奖金!它分为当期奖金(49%)和调节基金(2%)两部分。比如说,某期双色球销量为3亿元,那么,就有1.47亿元成为当期奖金,600万元成为调节基金。
接下来,我们通过 Python 对 2005-2018 年期间的数据进行分析,主要是通过此案例学习如何用 matplotlib 画直方图、气泡图以及更好看的气泡图。
一、直方图解读历年中奖注数
利用matplotlib画直方图,主要涉及到两个函数:
1.matplotlib.pyplot.bar(left, height, alpha=1, width=0.8, color=, edgecolor=, label=, lw=3)
参数含义:
left:x轴的位置序列,一般采用arange函数产生一个序列; height:y轴的数值序列,也就是柱形图的高度,一般就是我们需要展示的数据; alpha:透明度 width:为柱形图的宽度,一般这是为0.8即可; color或facecolor:柱形图填充的颜色; edgecolor:图形边缘颜色 label:解释每个图像代表的含义 linewidth or linewidths or lw:边缘or线的宽度
2.matplotlib.pyplot.legend()
plt.legend()函数主要的作用就是给图加上图例,plt.legend([x,y,z])里面的参数使用的是list的的形式,默认情况下是将label值赋给它。
详细代码:
效果图如下:
历年一等奖、二等奖中奖数
由上图可看出,13、14 年是获奖注数 Top 的一年,同时 13、14 年的销售额也是最多的,分别高达 549 亿、573 亿元。这其实与当年中国经济稳中向好也有关系,2013 年时中国经济关键的一年。这一年,全球经济风云变幻,美国经济增速回落,欧元区继续萎缩,巴西、俄罗斯、印度物价连续上涨,比特币升值近百倍……在这个全球经济一片哀鸣的2013 里,我国采取了多项措施来促进经济的稳定增长,在“黑天鹅”满天飞的2013年里,我国又发生了很多割接、牵动人心的改革事件。如上海自贸区挂牌、中国大妈炒金成为热门词汇,地王的记录频频被刷新等。
二、气泡图解读销售额的大小,与一等奖的占比率并没有关系
气泡图主要用到scatter()函数,具体用法如下:
- scatter(x,y) 在向量 x 和 y 指定的位置创建一个包含圆形的散点图。该类型的图形也称为气泡图。
- scatter(x,y,sz) 指定圆大小。要绘制大小相等的圆圈,请将 sz 指定为标量。要绘制大小不等的圆,请将 sz 指定为长度等于 x 和 y 的长度的向量。
- scatter(x,y,sz,c) 指定圆颜色。要以相同的颜色绘制所有圆圈,请将 c 指定为颜色名称或 RGB 三元数。要使用不同的颜色,请将 c 指定为向量或由 RGB 三元数组成的三列矩阵。
特别注意的是,s离散化的方法,因为需要通过点的大小来直观感受其所表示的数值大小,利用当前点的数值减去集合中的最小值后+0.1再*1000。
详细代码:
效果图如下:
历年销售额与一等奖的中奖占比率之间关系
由上图可看出,随着双色球销售额的变化,而一等奖占比率基本没变化,总是在0.06-0.75之间徘徊。
三、用Python画一张好看的气泡图
前面我们已经讲了如何画直方图、气泡图,接下来我们将直方图与气泡图,通过极坐标系将两者结合在一起展示出来,效果图如下:
详细代码:
最后,通过软件处理,添加一些文字性的描述,即可获得一张好看的可视化气泡图。觉得好看,大家也可以动手操作一遍!