数据类型-Series
- Series数据类型由一组数据和数据相关的索引组成,键 -> 值
- Series数据类型可视为:一维 带标签 数组
- Series基本操作类似数组和字典
Series数据类型的创建
首先载入库
import numpy as np
import pandas as pd
Python list列表 创建Series
a = pd.Series([1,2,3,4]) #默认索引
b = pd.Series([1,2,3,4],index=['a','b','c','d']) #自定义索引
s = pd.Series([True,1,2.3,'a','你好']) #数据类型
标量值 创建Series
c = pd.Series(10,index=['a','b','c']) #必须带index
Python字典 创建Series
d = pd.Series({'a':9,'b':8,'c':7})
ndarray 创建Series,索引和数据都可以通过ndarray类型生成
n = pd.Series(np.arange(5))
m = pd.Series(np.arange(5),index=np.arange(9,4,-1))
其他函数 创建Series
n = pd.Series(range(10))
Series类型的基本操作
index和value操作
b = pd.Series([9,8,7,6,5,4,3],['a','b','c','d','e','f','g'])
b
b.index # 获得索引,输出index类型,就是pandas独有的索引类型
b.values # 获得数据,输出类型为array,就是np的array数组
# 索引
b['b']
b[1] # 与上面相同,自动索引是默认生成的,和自定义索引并存
b.b
b[['c','d','a']]
b[['c','d',0]] #错误,两套索引并存,但不能混用
# 切片
b[:'d']
b['d':]
b[:3]
b[::2]
b[::-1]
类ndarray操作
- 索引方法相同,都有[]
- numpy中的运算和操作可用于Series类型
- 可以通过自定义索引的列表进行切片
- 可以通过自动索引进行切片,如果存在自定义索引,则一同被切片
b[3] #第3个值,结果是索引的值
b[:3] #0-3,结果还是Series类型
b[b > b.median()] #所有大于中位数的值
类python字典的操作
- 通过自定义索引访问
- 保留字in操作
- 使用.get()方法
b['b']
'c' in b #判断此键在不在b的索引中
0 in b #in 不会判断自动索引
b.get('f',100) #从b中提取索引f的值,如果存在就取出,不存在就用 100 代替
根据索引对齐操作
series + series
a = pd.Series([1,2,3],['c','d','e'])
b = pd.Series([9,8,7,6],['a','b','c','d'])
a + b #结果为两个值的并集,相加时索引对齐加值,索引不对齐的没值,加完也没值
- Series类型在运算中会自动对齐不同索引的数据
- ndarray基于维度运算,series基于索引运算,更精确不易出错
Series类型的name属性
Series对象和索引都可以起一个名字,存储在属性.name中
b = pd.Series([9,8,7,6],['a','b','c','d'])
b.name #默认没有
b.name = 'Series对象' #对象命名
b.index.name = '索引列' #索引命名
b
Series类型的修改
Series对象可以随时修改并立即生效
b['a'] = 15
b.name = 'Series'
b
b.name = 'new series'
b['b','c'] = 20 # b[['b','c']] = 20
b