一、学习python数据分析前的准备工作:下载Anaconda

anaconda是一个包管理器和环境管理器,其内置的jupyter notebook 功能非常强大,可以在jupyter notebook 中敲入代码、文字、图片形成我们所需的数据分析报告。

anaconda的两个下载渠道:

1.Downloads - Anacondawww.anaconda.com

anaconda prompt跳出python anaconda prompt python_python

(官网-外国服务器下载速度比较考验耐心)

2.Tsinghua Open Source Mirrormirrors.tuna.tsinghua.edu.cn

anaconda prompt跳出python anaconda prompt python_python_02

(清华大学镜像站-速度快)

安装成功后启动anaconda prompt内输入jupyter notebook 单击回车即可启动jupyter notebook啦~

二、python基础知识梳理

1.数据类型

String(字符串):如人的姓名,地名等文本,可以用两个英文状态下的单引号来表示(object)

int(整型):1,2,3,4,不带小数点

float(浮点型):1.2,1.456,4.689

bool(布尔型):True,False

容器:1)List列表2)Tuple元祖3)Set集合4)Dictionary字典

空值:None

2.变量

在python代码里用变量来存放数据,python语言里用=来给变量赋值(类比:在R语言里面用<-来给变量赋值)

eg:

a='小明'

b=5

c=6

3.注释

第一种:#

第二种:''' '''

示例如下:(python不会执行注释里面的内容)

3.入门list/set/tuple/dictionary

3.1 list

3.1.1方括号中添加元素并使用逗号分割开即可定义一个新的列表,切片时列表内的第一个元素的索引为0,最后一个元素的索引为-1

3.1.2 list使用append方法可在list末尾添加元素,list使用pop方法可以删除末尾的元素,list使用del加索引的方法可以删除list内指定位置的元素

3.2 tuple

3.2.1小括号中添加元素并使用逗号分割元素即可创建元组,元组内的元素不支持修改

3.3 set

3.3.1 花括号中添加元素并使用逗号分割元素即可创建集合,集合内不包括重复的元素

使用update方法加列表可更新集合,使用discard方法可删除集合内的元素

3.4 dictionary

key和value用冒号:对应,每个映射关系用逗号,分割,包括在花括号{}里面

4.if条件判断

if后面是判断条件,if条件需要加冒号:,多个if条件时后续的if可用elif表示,else后表示不符合前面if条件后返回的结果

5.for循环

把容器中的每一个数据进行重复处理,continue用于跳出当前循环,break用于退出整个循环

6.python里面常用的的包

在anaconda内可通过conda install +包名来实现包的安装

pandas、numpy、matplotlib(绘图包)、sklearn(机器学习包)

import可以引入需要的包,包内有强大的函数,可以提高我们的运算效率

7.def自定义函数

我这边用pandas包读取了一个链家的数据集,想取出每个经纪人成交单价排名前5的成交记录,这里我自定义了一个函数用以实现取出前5套:data数据长这样

我这里重新定义了一个top函数,这个top函数对组有效,对组内‘cjdanjia’这一列数据进行降序排序,并进行切片,返回组内前5名的数据

以上内容就是我整理的python的基础知识~