python -- 数据可视化
一、Matplotlib 绘图
1、图形对象(图形窗口)
mp.figure(窗口名称, figsize=窗口大小, dpi=分辨率,
facecolor=颜色)
如果"窗口名称"是第一次出现,那么就创建一个新窗口,其标题栏显示该名称,如果"窗口名称"已经出现过,那么不再创建新窗口,而只是将与该名称相对应的窗口设置为当前窗口。所谓当前窗口,就是接受后续绘图操作的窗口。
mp.title(标题文本, fontsize=字体大小)
mp.xlabel(水平轴标签, fontsize=字体大小)
mp.ylabel(垂直轴标签, fontsize=字体大小)
mp.tick_params(..., labelsize=刻度标签字体大小, ...)
mp.grid(linestyle=网格线型)
mp.tight_layout() # 紧凑布局
demo:
from __future__ import unicode_literals
import numpy as np
import matplotlib.pyplot as mp
x = np.linspace(-np.pi, np.pi, 1000) # -π — π,平分为1000等份
cos_y = np.cos(x) / 2
sin_y = np.sin(x)
mp.figure('Figure Object 1', figsize=(4, 3), dpi=120,
facecolor='lightgray') # figsize:窗口比例 ;dpi:像素 ; facecolor:颜色
mp.title('Figure Object 1', fontsize=16)
mp.xlabel('x', fontsize=12)
mp.ylabel('y', fontsize=12)
mp.tick_params(labelsize=8)
mp.grid(linestyle=':')
mp.tight_layout()
mp.figure('Figure Object 2', figsize=(4, 3), dpi=120,
facecolor='lightgray')
mp.title('Figure Object 2', fontsize=16)
mp.xlabel('x', fontsize=12)
mp.ylabel('y', fontsize=12)
mp.tick_params(labelsize=8)
mp.grid(linestyle=':')
mp.tight_layout()
mp.figure('Figure Object 1') # 覆盖第一个窗口
mp.plot(x, cos_y, c='dodgerblue',
label=r'$y=\frac{1}{2}cos(x)$')
mp.legend()
mp.figure('Figure Object 2')
mp.plot(x, sin_y, c='orangered',
label=r'$y=sin(x)$') # label为备注
mp.legend()
mp.show()
界面:
2、条形图
mp.bar(水平坐标, 高度, 宽度[, 底坐标], color=颜色,
alpha=透明度, label=图例标签)
demo:
# -*- coding: utf-8 -*-
from __future__ import unicode_literals
import numpy as np
import matplotlib.pyplot as mp
apples = np.array([
30, 25, 22, 36, 21, 29, 20, 24, 33, 19, 27, 15])
oranges = np.array([
24, 33, 19, 27, 35, 20, 15, 27, 20, 32, 20, 22])
mp.figure('Bar', facecolor='lightgray') # 绘图窗口
mp.title('Bar', fontsize=20)
mp.xlabel('Month', fontsize=14)
mp.ylabel('Price', fontsize=14)
mp.tick_params(labelsize=10) # x、y label的字体大小
mp.grid(axis='y', linestyle=':') # 网格线,y方向,点线类型
mp.ylim((0, 40)) # y轴范围:0-40
x = np.arange(len(apples))
mp.bar(x, apples, 0.4, color='dodgerblue',
label='Apple') # 0.4:宽度 ;
mp.bar(x + 0.3, oranges, 0.4, color='orangered',
label='Orange', alpha=0.75) # x+0.3:水平坐标,在x基础上便宜0.3
mp.xticks(x + 0.1, [
'Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun',
'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']) # x+0.1:x轴偏移0.1 ; mp.xticks(位置序列[, 标签序列])
mp.legend()
mp.show()
界面:
3、饼图
mp.pie(值, 间隙, 标签, 颜色, 格式,
shadow=是否带阴影, startangel=起始角度)
demo:
# -*- coding: utf-8 -*-
from __future__ import unicode_literals
import numpy as np
import matplotlib.pyplot as mp
values = [26, 17, 21, 29, 11]
spaces = [0.05, 0.01, 0.01, 0.01, 0.01] # 偏移值,每个饼分图之间的距离
labels = ['Python', 'JavaScript',
'C++', 'Java', 'PHP']
colors = ['dodgerblue', 'orangered',
'limegreen', 'violet', 'gold']
mp.figure('Pie', facecolor='lightgray')
mp.title('Pie', fontsize=20)
mp.pie(values, spaces, labels, colors, '%d%%',
shadow=True, startangle=90) # shadow:阴影 ; startangle:角度
# 等轴比例
mp.axis('equal')
mp.show()
界面:
4、等高线图
mp.contourf(x, y, z, 阶数, cmap=颜色映射)
mp.contour(x, y, z, 阶数, linewidths=线宽)
demo:
from __future__ import unicode_literals
import numpy as np
import matplotlib.pyplot as mp
n = 1000
# 网格化
x, y = np.meshgrid(np.linspace(-3, 3, n),
np.linspace(-3, 3, n))
z = (1 - x / 2 + x ** 5 + y ** 3) * np.exp(
-x ** 2 - y ** 2)
mp.figure('Contour', facecolor='lightgray')
mp.title('Contour', fontsize=20)
mp.xlabel('x', fontsize=14)
mp.ylabel('y', fontsize=14)
mp.tick_params(labelsize=10)
mp.grid(linestyle=':')
# 绘制等高线图
mp.contourf(x, y, z, 8, cmap='jet')
cntr = mp.contour(x, y, z, 8, colors='black',
linewidths=0.5)
# 为等高线图添加高度标签
mp.clabel(cntr, inline_spacing=1, fmt='%.1f',
fontsize=10)
mp.show()
界面:
5、热成像图
# origin ↓↓↓:
# hight: 缺省,原点在左上角
# low:原点在左下角
mp.imshow(矩阵, cmap=颜色映射, origin=纵轴方向)
#demo:
# -*- coding: utf-8 -*-
from __future__ import unicode_literals
import numpy as np
import matplotlib.pyplot as mp
n = 1000
# 网格化
x, y = np.meshgrid(np.linspace(-3, 3, n),
np.linspace(-3, 3, n))
z = (1 - x / 2 + x ** 5 + y ** 3) * np.exp(
-x ** 2 - y ** 2)
mp.figure('Hot', facecolor='lightgray')
mp.title('Hot', fontsize=20)
mp.xlabel('x', fontsize=14)
mp.ylabel('y', fontsize=14)
mp.tick_params(labelsize=10)
mp.grid(linestyle=':')
# 绘制热成像图
mp.imshow(z, cmap='jet', origin='low')
mp.colorbar().set_label('z', fontsize=14)
mp.show()
界面:
6、极坐标系
mp.gca(projection='polar')
水平坐标 -> 极角
垂直坐标 -> 极径
mp.plot(水平坐标, 垂直坐标, ...)
mp.plot(极角, 极径, ...)
demo:
# -*- coding: utf-8 -*-
from __future__ import unicode_literals
import numpy as np
import matplotlib.pyplot as mp
t = np.linspace(0, 2 * np.pi, 1001) # 1001个点,1000等分
r_spiral = 0.8 * t # 阿基米德螺旋线
r_rose = 5 * np.sin(6 * t) # 六元玫瑰线
mp.figure('Polar', facecolor='lightgray')
mp.gca(projection='polar') # 设置极坐标系
mp.title('Polar', fontsize=20)
mp.xlabel(r'$\theta$', fontsize=14)
mp.ylabel(r'$\rho$', fontsize=14)
mp.tick_params(labelsize=10)
mp.grid(linestyle=':')
# 函数值 = f (自变量)
# 垂直坐标 = f (水平坐标)
# 极径 = f (极角)
mp.plot(t, r_spiral, c='dodgerblue',
label=r'$\rho=0.8\theta$')
mp.plot(t, r_rose, c='orangered',
label=r'$\rho=5sin(6\theta)$')
mp.legend()
mp.show()
界面:
7、三维曲面
from mpl_toolkits.mplot3d import axes3d #3d
ax = mp.gca(projection='3d') # class axes3d 指定
ax.set_xlabel(...)
...
ax.plot_surface(x, y, z, rstride=行跨距, cstride=列跨距,
cmap=颜色映射) # 用于绘制表面图
ax.plot_wireframe(x, y, z, rstride=行跨距, cstride=列跨距,
linewidth=线宽, color=颜色) # 用于绘制三维线框图
demo:
1)三维表面图
import numpy as np
import matplotlib.pyplot as mp
from mpl_toolkits.mplot3d import axes3d
n = 1000
# 网格化
x, y = np.meshgrid(np.linspace(-3, 3, n),
np.linspace(-3, 3, n))
z = (1 - x / 2 + x ** 5 + y ** 3) * np.exp(
-x ** 2 - y ** 2)
mp.figure('3D Surface')
# 创建三维坐标系
ax = mp.gca(projection='3d') # 返回axes3d类的对象
mp.title('3D Surface', fontsize=20)
ax.set_xlabel('x', fontsize=14)
ax.set_ylabel('y', fontsize=14)
ax.set_zlabel('z', fontsize=14)
mp.tick_params(labelsize=10)
# 绘制三维表面图
ax.plot_surface(x, y, z, rstride=10, cstride=10,
cmap='jet')
mp.show()
界面:
2)三维线框图
from __future__ import unicode_literals
import numpy as np
import matplotlib.pyplot as mp
from mpl_toolkits.mplot3d import axes3d
n = 1000
# 网格化
x, y = np.meshgrid(np.linspace(-3, 3, n),
np.linspace(-3, 3, n))
z = (1 - x / 2 + x ** 5 + y ** 3) * np.exp(
-x ** 2 - y ** 2)
mp.figure('3D Wireframe')
# 创建三维坐标系
ax = mp.gca(projection='3d') # 返回axes3d类的对象
mp.title('3D Wireframe', fontsize=20)
ax.set_xlabel('x', fontsize=14)
ax.set_ylabel('y', fontsize=14)
ax.set_zlabel('z', fontsize=14)
mp.tick_params(labelsize=10)
# 绘制三维线框图
ax.plot_wireframe(x, y, z, rstride=30, cstride=30,
linewidth=0.5, color='dodgerblue')
mp.show()
界面:
二、numpy进阶
1、读取文件
# 逻辑上可被解释为二维数组的文本文件:
# 数据项1<分隔符>数据项2<分隔符>...<分隔符>数据项n ...
numpy.loadtxt(
文件路径,
delimiter=分隔符(默认空格),
usecols=列序列(默认读取所有列),
unpack=是否展开列(默认为False),
dtype=元素类型(默认为float),
converters=转换器字典(默认不做转换))
# unpack=False: 一个二维数组
# unpack=True: 多个一维数组
demo1:
import numpy as np
# 读取aapl.csv中的某些列数据
dates, opening_prices, highest_prices, lowest_prices, closing_prices = np.loadtxt(
'../../data/aapl.csv', # 文件路径
delimiter=',',
usecols=(1, 3, 4, 5, 6), # 读取1,3,4,5,6 列的数据,从0计数
unpack=True, # 展开成多个一维数组
dtype='M8[D], f8, f8, f8, f8', # 每列读取出来的元素类型不一样
)
demo2:画制 K线
K线介绍:
# -*- coding: utf-8 -*-
import datetime as dt
import numpy as np
import matplotlib.pyplot as mp
import matplotlib.dates as md
def dmyToymd(dmy):
# 将"日-月-年"格式转为"年-月-日"格式
dmy = str(dmy, encoding='utf-8') # dmy:字节问题,通过str utf8编码,将其转换为字符串格式
date = dt.datetime.strptime(dmy, "%d-%m-%Y").date() # 将字符串格式的对象的dmy,转换成日期对象,且指定为date类型,不包括具体时间
ymd = date.strftime("%Y-%m-%d") # 将日期对象重新转换成字符串格式并返回
return ymd
# 读取文件数据
# dates:日期 , opening_prices:开盘价, highest_prices:最高价 , lowest_prices:最低价 , closing_prices:收盘价
dates, opening_prices, highest_prices, lowest_prices, closing_prices = np.loadtxt(
"../data/aapl.csv",
delimiter = ",",
usecols = (1,3,4,5,6), # 读取1 ,3 ,4 ,5 ,6列的数据
unpack = True,
dtype = "M8[D], f8, f8, f8, f8", # 1列日期格式 Y-M-D,
converters = {1:dmyToymd} # 将读取到的第一列数据传入:dmyToymd函数中,执行过dmyToymd后再将值传回来,赋值给dates
)
# 画图
mp.figure("Candlestick", facecolor="lightgray")
mp.title("Candlestick", fontsize=20)
mp.xlabel("Date", fontsize=14)
mp.ylabel("Price", fontsize=14)
ax = mp.gca() # 拿到当前坐标轴
ax.xaxis.set_major_locator(md.WeekdayLocator(byweekday=md.MO)) # 设置水平坐标以星期(WeekdayLocator)为周期,并且设置每个星期的星期一(byweekday=md.MO)为主刻度
ax.xaxis.set_minor_locator(md.DayLocator()) # 设置水平坐标每一天为次刻度
ax.xaxis.set_major_formatter(md.DateFormatter("%Y-%m-%d")) # 设置水平坐标主刻度标签格式。 md.DateFormatter("%d %b %Y"):国际通用格式
mp.tick_params(labelsize=10) # 设置刻度线label大小
mp.grid(linestyle=":") # 设置网格及其格式
dates = dates.astype(md.datetime.datetime) # 将dates转换成matplotlib能识别的日期格式 ,不然会报错
# 阳线掩码,收盘价高于开盘价
rise = closing_prices - opening_prices >= 0.01
# 阴线掩码,收盘价低于开盘价
fall = opening_prices - closing_prices >= 0.01
# 填充色
fc = np.zeros(dates.size, dtype='3f4')
fc[rise], fc[fall] = (1, 1, 1), (0, 0.5, 0) # 填充色→ 阳线:白色 ,阴线:绿色
# 边缘色
ec = np.zeros(dates.size, dtype='3f4')
ec[rise], ec[fall] = (1, 0, 0), (0, 0.5, 0) # 边缘颜色→ 阳线:红色 ,阴线:绿色
# 柱状图,先画上下影线,再画中间方块
mp.bar(dates, highest_prices - lowest_prices, 0,
lowest_prices, color=fc, edgecolor=ec)
mp.bar(dates, closing_prices - opening_prices, 0.8,
opening_prices, color=fc, edgecolor=ec)
# 自动调整水平坐标轴的日期标签
mp.gcf().autofmt_xdate()
mp.show()
获取到的 aapl.csv 数据:
运行效果: