数据类型-Series

  • Series数据类型由一组数据和数据相关的索引组成,键 -> 值
  • Series数据类型可视为:一维 带标签 数组
  • Series基本操作类似数组和字典

Series数据类型的创建

首先载入库


import numpy as np
import pandas as pd



 

Python list列表 创建Series



a = pd.Series([1,2,3,4]) #默认索引
b = pd.Series([1,2,3,4],index=['a','b','c','d']) #自定义索引
s = pd.Series([True,1,2.3,'a','你好']) #数据类型



 

标量值 创建Series



c = pd.Series(10,index=['a','b','c']) #必须带index



 

Python字典 创建Series



d = pd.Series({'a':9,'b':8,'c':7})



 

ndarray 创建Series,索引和数据都可以通过ndarray类型生成



n = pd.Series(np.arange(5))
m = pd.Series(np.arange(5),index=np.arange(9,4,-1))



 

其他函数 创建Series



n = pd.Series(range(10))



 


Series类型的基本操作

index和value操作



b = pd.Series([9,8,7,6,5,4,3],['a','b','c','d','e','f','g'])
b
b.index # 获得索引,输出index类型,就是pandas独有的索引类型
b.values # 获得数据,输出类型为array,就是np的array数组

# 索引
b['b']
b[1] # 与上面相同,自动索引是默认生成的,和自定义索引并存
b.b

b[['c','d','a']]
b[['c','d',0]] #错误,两套索引并存,但不能混用

# 切片
b[:'d']
b['d':]
b[:3]

b[::2]
b[::-1]



 

类ndarray操作

  • 索引方法相同,都有[]
  • numpy中的运算和操作可用于Series类型
  • 可以通过自定义索引的列表进行切片
  • 可以通过自动索引进行切片,如果存在自定义索引,则一同被切片
b[3] #第3个值,结果是索引的值
b[:3] #0-3,结果还是Series类型
b[b > b.median()] #所有大于中位数的值



 

类python字典的操作

  • 通过自定义索引访问
  • 保留字in操作
  • 使用.get()方法
b['b']
'c' in b #判断此键在不在b的索引中
0 in b #in 不会判断自动索引
b.get('f',100) #从b中提取索引f的值,如果存在就取出,不存在就用 100 代替



 

根据索引对齐操作

series + series



a = pd.Series([1,2,3],['c','d','e'])
b = pd.Series([9,8,7,6],['a','b','c','d'])
a + b #结果为两个值的并集,相加时索引对齐加值,索引不对齐的没值,加完也没值



 

  • Series类型在运算中会自动对齐不同索引的数据
  • ndarray基于维度运算,series基于索引运算,更精确不易出错

Series类型的name属性

Series对象和索引都可以起一个名字,存储在属性.name中



b = pd.Series([9,8,7,6],['a','b','c','d'])
b.name #默认没有
b.name = 'Series对象' #对象命名
b.index.name = '索引列' #索引命名
b



 


Series类型的修改

Series对象可以随时修改并立即生效



b['a'] = 15
b.name = 'Series'
b
b.name = 'new series'
b['b','c'] = 20 # b[['b','c']] = 20
b