在工作中,不免进行一些数据的整理分析,从而来定位问题并解决,提高工作或者业务效率。发现新的机会点,保持持续的竞争优势。那么就来研究一下如何利用合适的工具,提升数据分析的效率。

1、流程

至于数据分析是什么以及有哪些种类,应该都有所了解,那么至于分析常规流程有哪些呢。一般包含如下步骤:

(1)目的明确,知道要分析什么

(2)知道数据如何获取

(3)处理获取到的数据

(4)分析数据

(5)得出分析结果

(6)验证

(7)展示分析结果

这些过程中,都离不开工具的帮助,熟练合理的运用分析工具就会事半功倍更好的处理数据并分析。

2、工具

一般数据分析工具离不开excel以及三方工具,但今天我们介绍的三方工具就是python,相信大家也很熟悉,因为excel可以通过人工鼠标键盘操作数据,而python可以通过代码直接操作excel,比如导入或者导出数据,在批量操作执行方面,python是占据优势的。

data = pd.read_excel(filepath+”cilliantest.xlsx”)读取.xlsx文件

3、工具下载安装

这里我们就不介绍如何安装官方版python,因为从官方下载后,虽然有很多现成的模块,但在调用之前需要自己手动安装需要的模块,这里对于初学python数据分析的小白还是不太友好,那么有没有直接安装打包好常用库的python工具呢,当然有,这里就来介绍一下Anaconda,这个工具其实就是python的一个开源版本,它的好处有啥呢,就是它自带一些常用的Python库,不需要自己手动安装,下面就介绍一下具体安装流程:

python 基础分析包 零基础python数据分析_python

(2)选择合适的系统和对应软件

python 基础分析包 零基础python数据分析_数据分析_02

我这是windows 64位的,大家不要选错哦

(3)点击下载后,双击安装包直接点next直到安装完成

python 基础分析包 零基础python数据分析_python 基础分析包_03

python 基础分析包 零基础python数据分析_职场和发展_04

(4)安装完成后,在电脑开始界面就会看到新添加的程序,看到这些说明python已经安装好了

python 基础分析包 零基础python数据分析_python_05

(5)点击后打开浏览器web界面

python 基础分析包 零基础python数据分析_python 基础分析包_06

4、jupter notebook使用

说到这里,就得说一下,ide和idel,ide表示集成开发环境,就是用来提供开发环境的程序,一般会包含编辑器、编译器、调试器、UI界面等,idel是ide中最简单基础的一种,其他例如vscode、pycharm、spyder、jupter notebook都是idel,数据分析方面,大家用的比较多的就是jupter notebook

(1)新建文件,点击右上角new,新建一个Python3文件

python 基础分析包 零基础python数据分析_开发语言_07

(2)编写程序文件

python 基础分析包 零基础python数据分析_python_08

(3)编写并运行第一段代码

python 基础分析包 零基础python数据分析_开发语言_09

(4)新建后,文件名字还没定,可以重命名并保存

python 基础分析包 零基础python数据分析_数据分析_10

点击file-rename即可,点击file-save and checkpoint 会保存在默认路径下,文件格式是默认的jupternotbook格式ipynb.

5、python基础

到了这里就得开始学习python的一些基础知识了,学好之后就可以利用python进行数据操作分析。

需要知道这么几个概念:列表、字典、数组、字符串、循环语句、函数、模块

6、pandas、numpy、matpotlib

学会以上的基础概念之后,就可以正式开始数据分析的操作了,这里会用到pandas、numpy、matplotlib这几个模块,直接导入即可

>>>import pandas as pd

>>>import numpy as np

>>>import matplotlib.pyplot as plt