注:我们是从折线图为例,由浅到深学习mqtplotlib,耐心学会了折线图,下面的条形,散点图是换形不变根
一、为什么要学matplotlib
1.能将数据进行可视化,更直观的呈现
2.使数据更加客观、更具有说服力
3.什么是matplotlib:matplotlib是最流行的python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建
二、基本要点
从上图可以看出,matplotlib绘图最基本要素是有(1)x轴 (2)y轴 (3)坐标值(红点)
通过一个例子对matplotlib的基本使用:假设一天中每隔两个小时(ranga(2,26,2))的气温分别是[15, 19, 14, 5, 17, 20, 25, 26, 26, 27, 22, 18, 16]。代码如下:
from matplotlib import pyplot as plt
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y = [15, 19, 14, 5, 17, 20, 25, 26, 26, 27, 22, 18,]
# 传入x, y通过plot绘制出图
plt.plot(x, y)
# 在执行程序时展示图形
plt.show()
效果如下:
上图我们可以看出x和y轴的刻度都是自动生成的刻度等,如果时自己看能的懂,但是给别人就看不懂,以上存在以下几个问题:
1.设置图片大小;2.调整x和y轴的刻度的间距;3.描述信息,比如x和y轴表示什么,这个图表示什么;4.样式(比如网格,颜色,透明度等);
针对以上问题对代码进行修改:
问题一:设置图片大小
figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数, 能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰 figsizes传入的是宽和高,代码如下:效果图可以自己复制代码运行,和图一进行对比
from matplotlib import pyplot as plt
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y = [15, 19, 14, 5, 17, 20, 25, 26, 26, 27, 22, 18,]
# 传入x, y通过plot绘制出图
plt.plot(x, y)
# 在执行程序时展示图形
plt.show()
问题二:调整x和y轴的刻度的间距,看注释
from matplotlib import pyplot as plt
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y = [15, 19, 14, 5, 17, 20, 25, 26, 26, 27, 22, 18,]
# 传入x, y通过plot绘制出图
plt.plot(x, y)
# 设置x轴的刻度,可以传入一个列表或列表推导式,也可以传入一个range,
plt.xticks(x)
# 当刻度太密集时使用列表的步长(间隔取值)来解决,matplotlib会自动帮我们对应
# plt.xticks(x[::2])
# 设置y轴,y轴的一些用法和x轴一样,但是我们在这里直接取y不合适,所以需要进行修改
plt.yticks(range(min(y), max(y)+1))
# 在执行程序时展示图形
plt.show()
效果图如下:
问题三: 描述信息,比如x和y轴表示什么,这个图表示什么
描述信息时,我们会发现中文无法显示的问题,所以需要设置中文显示,为什么无法显示中文 以为matplotlib默认不支持中文字符串,默认英语字体 修改matplotlib的默认字体:(1) 方法一:通过matplotlib.rc可以修改(window/linux) ;(2)方法二:通过matplptlib下的font_manager可以解决(window/linux/mac) ;(3)方法三:直接在xticks里面添加,“fontsize”是设置字体的大小,“fontproperties”是设置字体
1) 方法一:优点:不需要对字体路径硬编码,而且一次设置,多次使用,更方便;缺点:污染全局字体设置
from matplotlib import pyplot as plt
# 设置字体
font = {'family': 'FangSong',
'weight': 'bold',
'size': '16'}
plt.rc('font', **font)
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y = [15, 19, 14, 5, 17, 20, 25, 26, 26, 27, 22, 18,]
# 传入x, y通过plot绘制出图
plt.plot(x, y)
# 设置x轴的刻度,可以传入一个列表或列表推导式,也可以传入一个range,
plt.xticks(x)
# 当刻度太密集时使用列表的步长(间隔取值)来解决,matplotlib会自动帮我们对应
# plt.xticks(x[::2])
# 设置y轴,y轴的一些用法和x轴一样,但是我们在这里直接取y不合适,所以需要进行修改
plt.yticks(range(min(y), max(y)+1))
# 添加描述信息,记得要设置中文显示
# 添加x轴描述
plt.xlabel("时间")
# 添加y轴描述
plt.ylabel("温度 单位(摄氏度)")
# 添加标题描述
plt.title("一天中每隔两个小时气温变化情况")
# 在执行程序时展示图形
plt.show()
2) 方法二:这个方法需要查看自己电脑系统字体的路径,我的是win系统,系统字体路径是在C:\Windows\Fonts下,这个方法优点:一次设置,多次使用,更方便;缺点:污染全局字体设置
from matplotlib import font_manager
# 实例化一个font_manager
my_font = FontProperties(Fname="自己电脑系统字体的路径")
# 调用
plt.xticks(x, fontproperties='my_font')
3)方法三:这个方法用时才设置,且不会污染全局字体设置,更灵活 ,但是步骤繁琐
from matplotlib import pyplot as plt
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y = [15, 19, 14, 13, 17, 20, 25, 26, 26, 27, 22, 18]
# 传入x, y通过plot绘制出图
plt.plot(x, y)
# 设置x轴的刻度,可以传入一个列表或列表推导式,也可以传入一个range,
plt.xticks(x)
# 当刻度太密集时使用列表的步长(间隔取值)来解决,matplotlib会自动帮我们对应
# plt.xticks(x[::2])
# 设置y轴,y轴的一些用法和x轴一样,但是我们在这里直接取y不合适
plt.yticks(range(min(y), max(y)+1))
# 添加描述信息,记得要设置中文显示
# 添加x轴描述
plt.xlabel("时间", fontsize=14, fontproperties='FangSong')
# 添加y轴描述
plt.ylabel("温度 单位(摄氏度)", fontsize=14, fontproperties='FangSong')
# 添加标题描述
plt.title("一天中每隔两个小时气温变化情况", fontsize=1000, fontproperties='FangSong')
# 在执行程序时展示图形
plt.show()
通过以上设置效果图如下:
补充一个内容:设置字符串刻度:效果图如下:在x轴刻度上有2时,4时......等刻度
代码:
from matplotlib import pyplot as plt
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y = [15, 19, 14, 13, 17, 20, 25, 26, 26, 27, 22, 18]
# 传入x, y通过plot绘制出图
plt.plot(x, y)
# 设置x轴字符串刻度,这里用到字符串格式化format()方法
x1 = ["{}时".format(i) for i in range(2, 26, 2)]
plt.xticks(x, x1, fontsize=14, fontproperties='FangSong')
# 设置y轴,y轴的一些用法和x轴一样,但是我们在这里直接取y不合适
plt.yticks(range(min(y), max(y)+1))
# 添加描述信息,记得要设置中文显示
# 添加x轴描述
plt.xlabel("时间", fontsize=14, fontproperties='FangSong')
# 添加y轴描述
plt.ylabel("温度 单位(摄氏度)", fontsize=14, fontproperties='FangSong')
# 添加标题描述
plt.title("一天中每隔两个小时气温变化情况", fontsize=1000, fontproperties='FangSong')
# 在执行程序时展示图形
plt.show()
问题四:样式(比如网格,颜色,透明度等)
1)设置网格:我们只需要写入plt.grid()就行,grid()有很多参数,详解可以看:
from matplotlib import pyplot as plt
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y = [15, 19, 14, 13, 17, 20, 25, 26, 26, 27, 22, 18]
# 传入x, y通过plot绘制出图
plt.plot(x, y)
# 设置x轴字符串刻度,这里用到字符串格式化format()方法
x1 = ["{}时".format(i) for i in range(2, 26, 2)]
plt.xticks(x, x1, fontsize=14, fontproperties='FangSong')
# 设置y轴,y轴的一些用法和x轴一样,但是我们在这里直接取y不合适
plt.yticks(range(min(y), max(y)+1))
# 添加描述信息,记得要设置中文显示
# 添加x轴描述
plt.xlabel("时间", fontsize=14, fontproperties='FangSong')
# 添加y轴描述
plt.ylabel("温度 单位(摄氏度)", fontsize=14, fontproperties='FangSong')
# 添加标题描述
plt.title("一天中每隔两个小时气温变化情况", fontsize=1000, fontproperties='FangSong')
# 设置网格,alpha是设置网格的透明度
plt.grid(alpha=0.9)
# 在执行程序时展示图形
plt.show()
效果图如下:
2)多条折线
from matplotlib import pyplot as plt
import matplotlib
# 设置全局变量的中文字体
font = {'family': 'FangSong',
'weight': 'bold',
'size': '16'}
plt.rc('font', **font)
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y_1= [15, 19, 14, 13, 17, 20, 25, 26, 26, 27, 22, 18]
y_2 = [9, 13, 10, 17, 13, 19, 20, 28, 21, 18, 13, 20]
# 传入x, y通过plot绘制出图
plt.plot(x, y_1, label="折线一")
plt.plot(x, y_2, label="折线二")
# 添加图例,折线的名字才可以显示出来
plt.legend()
x1 = ["{}时".format(i) for i in range(2, 26, 2)]
plt.xticks(x, x1)
# 设置y轴,y轴的一些用法和x轴一样,但是我们在这里直接取y不合适
plt.yticks(range(min(y_2), max(y_1)+1))
# 添加描述信息,记得要设置中文显示
# 添加x轴描述
plt.xlabel("时间")
# 添加y轴描述
plt.ylabel("温度 单位(摄氏度)")
# 添加标题描述
plt.title("一天中每隔两个小时气温变化情况")
# 设置网格,alpha是设置网格的透明度
plt.grid(alpha=0.9)
# 在执行程序时展示图形
plt.show()
效果图:
3) 设置线条颜色,风格,粗细,透明度
from matplotlib import pyplot as plt
import matplotlib
# 设置全局变量的中文字体
font = {'family': 'FangSong',
'weight': 'bold',
'size': '16'}
plt.rc('font', **font)
'''figure是图形图标的意思,在这里指的是我们画的图,通过实例化一个figure并且传递参数,
能够在后台自动使用该figure实例,在图像模糊时传入dip参数(每英寸像素点多少个),让图片更加清晰
figsizes传入的是宽和高
'''
fig = plt.figure(figsize=(20, 8), dpi=80)
# x轴数据,是一个可迭代的对象
x = range(2, 26, 2)
# y轴数据,是一个可迭代的对象
y_1= [15, 19, 14, 13, 17, 20, 25, 26, 26, 27, 22, 18]
y_2 = [9, 13, 10, 17, 13, 19, 20, 28, 21, 18, 13, 20]
# 传入x, y通过plot绘制出图
plt.plot(x, y_1, label="折线一", color="orange", linestyle=":", linewidth=5, alpha=0.5)
plt.plot(x, y_2, label="折线二", color="cyan", linestyle="-.", linewidth=10, alpha=0.9)
# 添加图例,折线的名字才可以显示出来
plt.legend()
x1 = ["{}时".format(i) for i in range(2, 26, 2)]
plt.xticks(x, x1)
# 设置y轴,y轴的一些用法和x轴一样,但是我们在这里直接取y不合适
plt.yticks(range(min(y_2), max(y_1)+1))
# 添加描述信息,记得要设置中文显示
# 添加x轴描述
plt.xlabel("时间")
# 添加y轴描述
plt.ylabel("温度 单位(摄氏度)")
# 添加标题描述
plt.title("一天中每隔两个小时气温变化情况")
# 设置网格,alpha是设置网格的透明度
plt.grid(alpha=0.9)
# 在执行程序时展示图形
plt.show()
什么都添加后的效果图如下:
三、散点图:散点图的制作和上面的折线图差不多,只是将plt.plot()改成了plt.scatter()
例:假设你获取到了北京2016年3月和10月份每天白天的最高气温(分别位于列表ab),那么此时如何寻找出气温和随时间(天)变化的某种规律?
a=[11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]
b =[26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15,11,15,5,13,17,10,11,13,12,13,6]
代码:
from matplotlib import pyplot as plt
# 设置全局中文自已变量
font = {'family': 'FangSong',
'weight': 'bold',
'size': '16'}
plt.rc('font', **font)
y_3 = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]
y_10 = [26,26,28,19,21,17,16,19,18,20,20,19,22,23,17,20,21,20,22,15,11,15,5,13,17,10,11,13,12,13,6]
x_3 = range(1, 32)
x_10 = range(51, 82)
# 设置图片大小
plt.figure(figsize=(20, 8), dpi=80)
# 使用scatter方法制作出散点图,和之前绘制折线图的唯一区别
plt.scatter(x_3, y_3, label="3月份")
plt.scatter(x_10, y_10, label="10月份")
# 添加图例 loc是调整位置
plt.legend(loc="upper left")
# 调整x轴刻度
_x = list(x_3)+list(x_10)
_xticks_labels = ["3月{}日".format(i) for i in x_3]
_xticks_labels += ["11月{}日".format(i-50) for i in x_10]
plt.xticks(_x[::3], _xticks_labels[::3], rotation=45)
# 添加描述信息
plt.title("温度变化图")
plt.xlabel("时间")
plt.ylabel("温度(摄氏度)")
plt.show()
效果图:
四、条形图:条形图也是一样的道理,使用plt.bar()方法
例:假设你获取到了2017年内地电影票房前20的电影(列表a)和电影票房数据(列表b),那么如何更加直观的展示该数据?
a=["战狼2","速度与激情8,"功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士"“摔跤吧!爸爸","加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终极回归""生化危机6:终章","乘风破浪","神偷奶爸3","智取威虎山","大闹天竺","金刚狼3:殊死一战","蜘蛛侠:英雄归来":"悟空传","银河护卫队2","情圣","新木乃伊",]
b=[56.01, 26.94, 17.53, 16.49, 15.45, 12.96, 11.8, 11.61, 11.28, 11.12, 10.49, 10.3, 8.75, 7.55, 7.32, 6.99, 6.88, 6.86, 6.58, 6.23]单位:亿
代码:
from matplotlib import pyplot as plt
# 设置全局中文自已变量
font = {'family': 'FangSong',
'weight': 'bold',
'size': '16'}
plt.rc('font', **font)
# 设置图片大小
plt.figure(figsize=(20, 10), dpi=80)
# 名字太长的为了显示完全使用换行符
x = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:\n最后的骑士","摔跤吧!爸爸","加勒比海盗5:\n死无对证","金刚:骷髅岛","极限特工:\n终极回归","生化危机6:\n终章","乘风破浪","神偷奶爸3","智取威虎山","大闹天竺","金刚狼3:\n殊死一战","蜘蛛侠:\n英雄归来","悟空传","银河护卫队2","情圣","新木乃伊"]
y = [56.01, 26.94, 17.53, 16.49, 15.45, 12.96, 11.8, 11.61, 11.28,
11.12, 10.49, 10.3, 8.75, 7.55, 7.32, 6.99, 6.88, 6.86, 6.58, 6.23]
'''这里首先把x轴和y轴先画出来,后面在使用plt.xticks()方法把字符串传入刻度(电影的名字)
其实直接传入x也行,不过下面的这种方法更严谨些
'''
plt.bar(range(len(x)), y, width=0.3, color="orange")
# 设置字符串到x轴
plt.xticks(range(len(x)), x, rotation=90)
# 设置y轴刻度
_y = list(range(5, 60))
plt.yticks(_y[::3])
# 添加网格
plt.grid()
# 添加描述
plt.title("电影票房数据显示")
plt.ylabel("单位:亿元")
plt.show()
效果图:
此时我们发现电影名字显示有些不行,此时我们可以用plt.barh()方法把条形图倒过来(把电影名字放到y轴),此时代码里面的参数(x轴的应当y轴用,y轴应当x轴用)。代码如下:
from matplotlib import pyplot as plt
# 设置全局中文自已变量
font = {'family': 'FangSong',
'weight': 'bold',
'size': '16'}
plt.rc('font', **font)
# 设置图片大小
plt.figure(figsize=(20, 10), dpi=80)
# 名字太长的为了显示完全使用换行符
x = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:最后的骑士","摔跤吧!爸爸","加勒比海盗5:死无对证","金刚:骷髅岛","极限特工:终极回归","生化危机6:终章","乘风破浪","神偷奶爸3","智取威虎山","大闹天竺","金刚狼3:殊死一战","蜘蛛侠:英雄归来","悟空传","银河护卫队2","情圣","新木乃伊"]
y = [56.01, 26.94, 17.53, 16.49, 15.45, 12.96, 11.8, 11.61, 11.28,
11.12, 10.49, 10.3, 8.75, 7.55, 7.32, 6.99, 6.88, 6.86, 6.58, 6.23]
'''这里首先把x轴和y轴先画出来,后面在使用plt.xticks()方法把字符串传入刻度(电影的名字)
其实直接传入x也行,不过下面的这种方法更严谨些
'''
plt.barh(range(len(x)), y, height=0.3, color="orange")
# 设置字符串到x轴
plt.yticks(range(len(x)), x,)
# 设置y轴刻度
_y = list(range(5, 60))
plt.xticks(_y[::3])
# 添加网格
plt.grid()
# 添加描述
plt.title("电影票房数据显示")
plt.xlabel("单位:亿元")
plt.show()
效果图:
补充:绘制多次条形图
例:假设你知道了列表a中电影分别在2017-09-14(b_14),2017-09-15(b_15),2017-09-16(b_16)三天的票房,为了展示列表中电影本身的票房以及同其他电影的数据对比情况,应该如何更加直观的呈现该数据?
代码如下:
from matplotlib import pyplot as plt
# 设置全局中文自已变量
font = {'family': 'FangSong',
'weight': 'bold',
'size': '16'}
plt.rc('font', **font)
# 设置图片大小
plt.figure(figsize=(20, 10), dpi=80)
a = ["猩球崛起3:终极之战", "敦刻尔克", "蜘蛛侠:英雄归来", "战狼2"]
b_16 = [15746, 312, 4497, 319]
b_15 = [12357, 156, 2045, 168]
b_14 = [2358, 399, 2358, 362]
'''想要绘制多次条形,首先先绘制第一个条形,然后在这个条形上依次向旁边
挪动一些距离(距离可以自己设置)
'''
# 设置条形粗细变量,方便调节
bar_width = 0.1
# 移动距离
x_14 = list(range(len(a)))
x_15 = [i+bar_width for i in x_14]
x_16 = [i+bar_width*2 for i in x_14]
# 绘制
plt.bar(range(len(a)), b_14, width=bar_width, label="9月14日")
plt.bar(x_15, b_15, width=bar_width, label="9月15日")
plt.bar(x_16, b_16, width=bar_width, label="9月16日")
# 摄制图例
plt.legend()
# 设置x轴刻度 为什么是x_15,因为x_15对应1的是三个条形的中间
plt.xticks(x_15, a)
# 添加网格
plt.grid()
# 添加描述
plt.title("三日电影票房数据")
plt.ylabel("单位:亿元")
plt.show()
效果图:
五、总结:
(1)折线图的上升和下降来表示统计数量的增减变化趋势的统计图,特点:能够显示数据的变化趋势,反映事物的变化情况(变化)
(2)条形图:排列在工作表的列或行中的数据可以绘制到条形图中。特点:绘制连离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计)
(3)散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。特点:判断变量之间是否存在数量关联趋势,展示高群点(分布规律)
好了,我们就到这里,想要绘制更多的图,可以参考matplotlib文档,里面有各种各样的图的代码,像echart一样复制代码,修改x和y轴的数据就行