python 数据框按照列名选取多列

原创

mob64ca12e95b2b 2023-09-29 20:39:37 ©著作权

文章标签 数据多列 python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob64ca12e95b2b的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python数据框按照列名选取多列

在数据分析和数据处理过程中，经常需要从数据框中选择特定的列进行操作。Python中的pandas库提供了灵活的方法来选择数据框中的多列，使得数据处理更加高效和便捷。本文将介绍如何使用pandas选择数据框中的多列，并通过实例演示其用法。

pandas库简介

Pandas是一个强大的数据处理和分析工具，提供了多种数据结构和数据操作方法。其中最常用的数据结构是Series和DataFrame。DataFrame是一个二维数据结构，类似于关系型数据库中的表格，可以用于存储和处理大量的结构化数据。

选取单列

在pandas中，可以通过列名直接选取单列数据。下面是一个简单的示例：

import pandas as pd

# 创建一个数据框
data = {'Name': ['John', 'Peter', 'Alice', 'Mike'],
        'Age': [25, 30, 28, 35],
        'City': ['New York', 'London', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)

# 选取单列数据
name = df['Name']
print(name)

输出结果为：

0     John
1    Peter
2    Alice
3     Mike
Name: Name, dtype: object

在上面的示例中，我们创建了一个包含姓名、年龄和城市的数据框。通过df['Name']可以选取出名字列，并将其赋值给变量name。打印name可以看到选取的结果。

选取多列

如果需要同时选取多列数据，可以传入一个列名列表来实现。下面是一个示例：

import pandas as pd

# 创建一个数据框
data = {'Name': ['John', 'Peter', 'Alice', 'Mike'],
        'Age': [25, 30, 28, 35],
        'City': ['New York', 'London', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)

# 选取多列数据
subset = df[['Name', 'City']]
print(subset)

输出结果为：

    Name       City
0   John   New York
1  Peter     London
2  Alice      Paris
3   Mike      Tokyo

在上面的示例中，我们传入一个包含列名的列表['Name', 'City']来选取名字和城市两列数据。通过df[['Name', 'City']]可以同时选取出这两列，并将其赋值给变量subset。打印subset可以看到选取的结果。

选取连续的列

如果需要选取连续的列，可以使用切片操作符:来实现。下面是一个示例：

import pandas as pd

# 创建一个数据框
data = {'Name': ['John', 'Peter', 'Alice', 'Mike'],
        'Age': [25, 30, 28, 35],
        'City': ['New York', 'London', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)

# 选取连续的列
subset = df.loc[:, 'Name':'Age']
print(subset)

输出结果为：

    Name  Age
0   John   25
1  Peter   30
2  Alice   28
3   Mike   35

在上面的示例中，我们使用df.loc[:, 'Name':'Age']来选取从名字到年龄连续的列。通过:指定了切片的范围，并将其赋值给变量subset。打印subset可以看到选取的结果。

选取不连续的列

如果需要选取不连续的列，可以使用df.loc方法，并传入一个布尔型列表来实现。下面是一个示例：

import pandas as pd

# 创建一个数据框
data = {'Name': ['John', 'Peter', 'Alice', 'Mike'],
        'Age': [25, 30, 28, 35],
        'City': ['New York', 'London', 'Paris', 'Tokyo']}
df = pd.DataFrame(data)

# 选取不连续的列
subset = df.loc[:, ['Name', 'City']]
print(subset)

输出结果为：

    Name       City
0   John   New York
1

上一篇：python的获取散点图的外轮廓

下一篇：java保留两位数字

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯