python列合并成一列

原创

mob649e816347dd 2023-10-21 10:47:34 ©著作权

文章标签 数据 python Python 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob649e816347dd的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python 列合并成一列

在Python编程中，我们经常需要处理各种数据集合。有时候，我们需要将多个列合并成一列，在数据分析和处理过程中非常常见。本文将介绍如何使用Python将多个列合并成一列，以及一些常见的应用场景和示例。

什么是列合并？

在数据处理中，列合并（column merge）是指将多个列中的数据合并成一列的操作。通常情况下，我们会有多个列，每一列都包含一些数据，通过列合并操作可以将这些数据合并在一起，形成一个新的列。

为什么需要列合并？

列合并操作在数据分析和处理中非常有用。以下是一些常见的应用场景：

数据清洗：在数据清洗过程中，我们可能需要将多个列的数据合并成一列，便于后续处理和分析。
特征工程：在特征工程中，我们经常需要将多个特征列合并成一个特征向量，以供机器学习模型使用。
数据转换：有时候，我们需要将数据从宽格式转换为长格式，即将多个列合并成一列，以便更好地进行数据分析和可视化。

如何合并多个列？

在Python中，我们可以使用多种方法将多个列合并成一列。以下是几种常见的方法：

1. 使用加号操作符

import pandas as pd

# 创建一个DataFrame
data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}
df = pd.DataFrame(data)

# 合并多个列
df['D'] = df['A'] + df['B'] + df['C']

上述代码中，我们使用了加号操作符将列A、B和C的数据相加，并将结果保存在新的列D中。

2. 使用concat()函数

import pandas as pd

# 创建一个DataFrame
data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}
df = pd.DataFrame(data)

# 合并多个列
df['D'] = pd.concat([df['A'], df['B'], df['C']])

上述代码中，我们使用了concat()函数将列A、B和C的数据合并成一列，并将结果保存在新的列D中。

3. 使用apply()函数

import pandas as pd

# 创建一个DataFrame
data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}
df = pd.DataFrame(data)

# 合并多个列
df['D'] = df.apply(lambda row: ''.join([str(row['A']), str(row['B']), str(row['C'])]), axis=1)

上述代码中，我们使用了apply()函数和lambda函数将列A、B和C的数据合并成一列，并将结果保存在新的列D中。

4. 使用join()函数

import pandas as pd

# 创建一个DataFrame
data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}
df = pd.DataFrame(data)

# 合并多个列
df['D'] = df[['A', 'B', 'C']].apply(lambda x: ''.join(x), axis=1)

上述代码中，我们使用了join()函数和lambda函数将列A、B和C的数据合并成一列，并将结果保存在新的列D中。

示例应用

案例一：合并电话号码

假设我们有一个电话号码的数据集，其中包含了三列：国家代码、区号和电话号码。我们想将这三列合并成一列，形成完整的电话号码。

import pandas as pd

# 创建一个DataFrame
data = {'CountryCode': ['+86', '+1', '+44'],
        'AreaCode': ['010', '213', '208'],
        'PhoneNumber': ['12345678', '98765432', '654