今天要介绍两个一行代码就可以生成数据分析报告的库,分别是sweetviz和pandas_profiling。

首先我们从码云上下载测试数据:

import pandas as pd
import numpy as np

titanic = pd.read_csv("https://gitee.com/hyesc/machine-learning-stu/raw/master/titanic.csv")
titanic.head()

可一键生成数据分析报告的两个库_github

sweetviz

参考:https://github.com/fbdesignpro/sweetviz

sweetviz需要使用pip进行安装:

pip install sweetviz

然后就可以进行分析了:

import sweetviz as sv

my_report = sv.analyze(titanic)
my_report.show_html()

可一键生成数据分析报告的两个库_数据分析_02

几秒钟后便会自动打开相应的网页:

可一键生成数据分析报告的两个库_github_03

pandas_profiling

参考:https://github.com/pandas-profiling/pandas-profiling

安装:

pip install pandas-profiling

使用:

import pandas_profiling

pfr = pandas_profiling.ProfileReport(titanic)
pfr.to_file('report.html')

等待10秒左右可以看到结果:

可一键生成数据分析报告的两个库_github_04

需要手动打开页面:

可一键生成数据分析报告的两个库_html_05

在jupyter环境中直接访问pfr,会直接在notebook输出中显示网页。