pandas按行,按列取值,主要使用的是ilocloc函数进行取值

下面就介绍下取值

python 对数据进行隔行隔列采样 pandas隔行提取数据_c函数


这个是我创建的数据,现在我们需要取出第一行到第五行,第一列到第5列的数据

import pandas as pd

data = pd.read_excel('excel_col.xlsx')
# 因为列索引和行索引都是从0开始,所以只需要取到5,但不包含5,有点类似于列表取值
print(data.iloc[:5,:5])

python 对数据进行隔行隔列采样 pandas隔行提取数据_计算机视觉_02


如果想直接从第3列开始

data.iloc[:5,2:5]

python 对数据进行隔行隔列采样 pandas隔行提取数据_c函数_03


以上为iloc函数,iloc[],前面的为取行,然后使用,隔开再取列

如果取单独的一行,用第1行举例,取第1行,从第4列开始,取到最后一列

data.iloc[0,3:]

python 对数据进行隔行隔列采样 pandas隔行提取数据_计算机视觉_04


列同上,如果是取单独的一列或者单独的一行,则类型为series

python 对数据进行隔行隔列采样 pandas隔行提取数据_python_05


接下来使用loc函数,loc函数,不同于iloc,loc函数后面的列,必须为列名,不能直接是列的索引(即数字)

因为我的数据比较特殊,列名是用数字代替的,所以希望大家不要混肴

还是一样,取前4行,前4列

需要注意的是对于**iloc[]函数来讲,我们指定最后一行的时候,是不包含的,但是loc[]**是包含的

# 后面的列表里面是列名,取得是多个列名时候,使用列表包起来
data.loc[0:3,[0,1,2,3]]

python 对数据进行隔行隔列采样 pandas隔行提取数据_opencv_06


有时候,我们读取的是两个文件,然后根据第一个文件满足条件的行,取第二个文件的行数

使用loc即可满足

python 对数据进行隔行隔列采样 pandas隔行提取数据_python_07


python 对数据进行隔行隔列采样 pandas隔行提取数据_opencv_08


上面是两个dataframe

现在我需要在第一个dataframe取出第一列满足<50数字的行,然后取出data2中的行

data1中第一列,小于50的有第2,4,5,13,14行,然后我们取出data2中的2,4,5,13,14行,因为索引从零开始

所以最后的行的索引是1,3,4,12,13

import pandas as pd

data = pd.read_excel('excel_col.xlsx')
data2 = pd.read_excel('test.xlsx')

# 先将第一列,转换为list
list_new = data.iloc[:,0].tolist()
# 取<50的数字的index
sat_list = [list_new.index(i) for i in list_new if i < 50]
# 使用loc直接取满足条件的data2数据的所有行
# 上面说过因为loc,后面的列必须是列名,所有data2.columns.tolist()直接取所有的列名,并转换为list
new_data = data2.loc[sat_list,data2.columns.tolist()]

python 对数据进行隔行隔列采样 pandas隔行提取数据_python_09