一、Numpy Pandas
1.1 简介
方便数组 矩阵运算
1.2 优势
运算速度快:numpy 和 pandas 都是采用 C 语言编写, pandas 又是基于 numpy, 是 numpy 的升级版本。
消耗资源少:采用的是矩阵运算,会比 python 自带的字典或者列表快好多。
代码更简洁:大量的数学函数【数组、矩阵】
性能更高效:数组 自己的存储格式,比原生的List好很好。
二、安装Numpy
2.1 anaconda
1.自带了Numpy,继承了非常多的库,首选安装环境。
2.pip install numpy
import numpy as np
三、Numpy vs Python
3.1 数组加法
1.数组 A B为1~N的数字的平方和立方
1 2 4 9 …
1 3 27 64 …
四、Numpy-Array
1.Numpy的核心数据结构,就叫做array就是数组, array对象可以是一维数组, 也可以是多维数组;
2.Python的List也可以实现相同的功能, 但是aray比List的优点在于性能好、 包含数组元数据信息大量的便捷函数;
3.Numpy成为事实上的Scipy. Pandas、 Scikit-Learn. Tensorflow. PaddlePaddle等框架的“通用底层语言”
4.Numpy的array和Python的List的一 个区别,它元素必须都是同一种数据类型,比如都是数字int类型,这也是Numpy高性能的一个原因;
array本身的属性
●shape: 返回一个元组,表示array的维度
●ndim: -个数字,表示array的维度的数目
●size: -个数字,表示array中所有数据元素的数目
●dtype: array中元素的数据类型
4.1 Array创建操作
1.从Python的列表L ist和嵌套列表创建array
2.使用预定函数arange. ones/ones_ like. zeros/zeros_ ike. empty/empty like. fllulll like. eye等函数创建
3.生成随机数的np.random模块构建
4.2 数组索引查询
1.给已有的数据添加多行,比如增添一些样本数据进去;
2.给已有的数据添加多列,比如增添一些特征进去;
以下操作均可以实现数组合并:
●np.concatenatelarray_ list, axis=0/1) : 沿着指定axis进行数组的合并
●np.vstack或者np.row_ stackarray_ list) :垂直vertically.按行row wise进行数据合并
●np.hstack或者np.column_ stackarray_ Jist) :水平horizontally.按列column wise进行数据合并
Numpy与Pandas数据的相互转换
Pandas是在Numpy基础上建立的非常流行的数据分析类库;
提供了强大针对异构、表格类型数据的处理与分析能力。
本节绍Numpy和Pandas的转换方法:
- Numpy数组怎样输入给Pandas的Series、DataFrame ;
- Pandas的Series、 DataFrame怎样转换成Numpy的数组