在很早之前关于可视化的描述中,我们介绍过一款D-table的数据分析操作工具。和D-table的操作相似,还有一款pandasGUI的开源工具更加强势。

Pandasgui是一个开源的python模块,它为pandas创建了一个GUI界面,我们可以在其中使用pandas的功能分析数据和使用不同的功能,以便可视化和分析数据,并执行探索性数据分析。更重要的是 pandasGUI 的交互式数据绘图模块是值得一提的,主要包含几个特征:

  1. 支持DataFrames和Series数据
  2. 提供了交互式绘图
  3. 数据筛选、处理
  4. 统计摘要
  5. 数据编辑和复制/粘贴
  6. 拖放导入CSV文件


文章目录

  • 技术提升
  • 1. pandasGUI安装
  • 2. pandasGUI启动
  • 3.数据导入
  • 4. 数据筛选


技术提升

本文由技术群粉丝分享,项目源码、数据、技术交流提升,均可加交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友

方式①、添加微信号:dkl88191,备注:来自CSDN +研究方向
方式②、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

1. pandasGUI安装

安装过程也比较顺利,使用pip的方式直接安装,这里默认使用了清华大学的镜像站。

pip install pandasgui -i https://pypi.tuna.tsinghua.edu.cn/simple

注意:请尽量采用windows10以上操作系统,使用windows7在安装时会出现问题,其中底层依赖用到的python非标准模块较多,请耐心等待安装完成。

2. pandasGUI启动

启动pandasGUI的方式也比较简单,只需要几行代码并导入需要的python模块即可。

# Importing the pandas module and giving it the alias pd.  
import pandas as pd  
  
# Importing the `show` function from the `pandasgui` module.  
from pandasgui import show  
  
data_frame = pd.DataFrame()  
  
show(data_frame)

这个时候直接启动pandasGUI发现缺少了win32api模块,就像下面这样。

import win32api  
ModuleNotFoundError: No module named 'win32api'

我们再来使用pip的方式安装一下pywin32模块即可。

pip install pywin32 -i https://pypi.tuna.tsinghua.edu.cn/simple

这次我们再运行上面的代码块就可以直接启动pandasGUI了,启动之后出现一个桌面的小工具。

开源大数据ELK 开源大数据可视化 ui_数据分析

接下来,我们就可以直接使用pandasGUI来处理相关的数据了,主要支持了.json、.xlsx、.csv的数据格式。

3.数据导入

在edit菜单下面直接使用import导入我们需要处理的数据文件。

在做文件数据导入的时候又发现了缺少openpyxl模块。

ModuleNotFoundError: No module named ‘openpyxl’

同样,使用pip的方式安装一下即可。

pip install openpyxl -i https://pypi.tuna.tsinghua.edu.cn/simple

由于是python的新环境,有些模块并没有自动安装,因此需要我们手动安装一下,安装完成之后重新启动一下。

再来导入一下我们准备好的数据文件。

开源大数据ELK 开源大数据可视化 ui_数据_02

4. 数据筛选

数据筛选也比较简单,只需要输入字段对应的筛选条件即可,比如我们需要筛选年龄大于10的数据,添加如下筛选条件即可。

年龄 > 10

开源大数据ELK 开源大数据可视化 ui_开源大数据ELK_03

其他的使用方式都比较简单,这里就不多作介绍了,下面主要来看一下几种比较好的数据可视化操作。

开源大数据ELK 开源大数据可视化 ui_数据分析_04

开源大数据ELK 开源大数据可视化 ui_数据_05

开源大数据ELK 开源大数据可视化 ui_数据_06