目录

1.简介

2.Graphviz 工具安装

3.检查是否安装成功 

4. Graphviz 库安装

5.验证安装的graphviz是否可用 

6.绘制红酒数据集得到的决策树: 

7.问题:pycharm正常画决策树,但jupyter显示:ModuleNotFoundError: No module named 'graphviz'

1.简介

Graphviz 是一款由 AT&T Research 和 Lucent Bell 实验室开源的可视化图形工具,可以很方便的用来绘制结构化的图形网络,支持多种格式输出。Graphviz 输入是一个用 dot 语言编写的绘图脚本,通过对输入脚本的解析,分析出其中的点、边及子图,然后根据属性进行绘制。Graphviz layout 以简单的文本语言描述图形,并以实用的格式制作图表,如用于网页的 images 和 SVG ;用于放入在其它文件中或显示在交互式图形浏览器中的 PDF 和 Postscript 。

对于 Python 而言,也有一个 Graphviz 库与该工具对应,使用 Graphviz 库可以使用 Python 的语法生成 dot 语言绘图脚本,并调用 Graphviz 工具生成图片并保存。但是由于 Graphviz 库并不是独立工作的库,它需要连接 Graphviz 工具来联合工作,也就是说当你需要使用 Graphviz 库时必须安装 Graphviz 工具并设置好 Python 调用 Graphviz 工具的接口。

不会出错的安装

如果我们需要在Python中直接将.dot文件转成pdf显示出来,就需要导入库,安装库也很简单,只需要执行pip install graphviz 即可。
 

2.Graphviz 工具安装

python图形化编程的基本步骤 python图形化编程软件_工具安装

然后往下拉找到windows的安装包(我是windows环境),下载你需要的版本。

python图形化编程的基本步骤 python图形化编程软件_工具安装_02

python图形化编程的基本步骤 python图形化编程软件_开发语言_03

python图形化编程的基本步骤 python图形化编程软件_工具安装_04

3.检查是否安装成功 

Win键+R 打开运行 输出 cmd
输入dot -version 出现一下界面说明安装成功,会显示你的版本号和安装位置。

是dot -version

而不是dot --version,参看别人博客,导致在这弄了很久,避雷吧

python图形化编程的基本步骤 python图形化编程软件_工具安装_05

4. Graphviz 库安装

解决:CondaSSLError: Encountered an SSL error. Most likely a certificate verification issue.

python图形化编程的基本步骤 python图形化编程软件_数据集_06

 然后到pycharm里将其添加:

python图形化编程的基本步骤 python图形化编程软件_python图形化编程的基本步骤_07

python图形化编程的基本步骤 python图形化编程软件_python图形化编程的基本步骤_08

5.验证安装的graphviz是否可用 

from graphviz import Digraph

dot = Digraph('测试')
dot.node("1","Life's too short")
dot.node("2","I learn Python")
dot.edge('1','2')

dot.view()

 运行会得到:

python图形化编程的基本步骤 python图形化编程软件_python图形化编程的基本步骤_09

6.绘制红酒数据集得到的决策树: 

from sklearn import tree # 导入树
from sklearn.datasets import load_wine #红酒数据集
from sklearn.model_selection import train_test_split #数据集的分割操作

wine = load_wine() #加载数据集

import pandas as pd #利用pandas将data与target拼接成数据表
pd.concat([pd.DataFrame(wine.data),pd.DataFrame(wine.target)],axis=1)

Xtrain,Xtest,Ytrain,Ytest = train_test_split(wine.data,wine.target,test_size=0.3) #将数据集划分为训练集和测试集

clf = tree.DecisionTreeClassifier(criterion='entropy') #实例化一个决策分类树模型
clf = clf.fit(Xtrain,Ytrain) #模型拟合
score = clf.score(Xtest,Ytest) #返回预测的准确度accuracy
feature_name = ['酒精','苹果酸','灰','灰的碱性','镁','总酚','类黄酮','非黄烷类酚类',
                '花青素','颜色强度','色调','od280/od315稀释葡萄酒','脯氨酸']
import graphviz
dot_data = tree.export_graphviz(clf
                               ,out_file = None
                               ,feature_names= feature_name
                               ,class_names=["琴酒","雪莉","贝尔摩德"]
                               ,filled=True
                               ,rounded=True
                               ) # 第一个参数为实例化的模型参数
graph = graphviz.Source(dot_data) #绘制决策树
graph.view()

graph = graphviz.Source(dot_data) #绘制决策树 graph.view() #会通过生成PDF的形式展现决策树

python图形化编程的基本步骤 python图形化编程软件_python_10

7.问题:pycahrm正常画决策树,但jupyter显示:ModuleNotFoundError: No module named 'graphviz'

python图形化编程的基本步骤 python图形化编程软件_工具安装_11

解决:

python图形化编程的基本步骤 python图形化编程软件_开发语言_12

 

python图形化编程的基本步骤 python图形化编程软件_python_13

 

妥了。