Polars 常用操作指南

Polars 是一个用 Rust 编写的 DataFrame 库,它提供了灵活且高效的数据操作方法。

添加列

在 Polars 中,您可以轻松地为 DataFrame 添加新列。

示例代码:添加列

import polars as pl
# 创建一个示例 DataFrame
df = pl.DataFrame({
    "a": [1, 2, 3],
    "b": ["foo", "bar", "baz"]
})
# 添加新列 "c",值为 "p", "q", "r"
df = df.with_columns(pl.Series(["p", "q", "r"]).alias("c"))

类型转换

Polars 允许您在不同的数据类型之间进行转换。

示例代码:类型转换

# 将列 "a" 从整数类型转换为浮点数类型
df = df.with_columns(pl.col("a").cast(float))

重命名列

您可以轻松地重命名 DataFrame 中的列。

示例代码:重命名列

import polars as pl
# 创建一个示例 DataFrame
df = pl.DataFrame({
    "a": [1, 2, 3],
    "b": ["foo", "bar", "baz"]
})
# 重命名列 "a" 为 "banana"
df.columns = ["banana", "orange"]

删除列

您可以从 DataFrame 中删除列。

示例代码:删除列

# 删除列 "b"
df = df.drop("b")

删除空值

您可以轻松地删除 DataFrame 中的空值。

示例代码:删除空值

# 删除 DataFrame 中的所有空值
df = df.drop_nulls()

填充缺失值

您可以使用不同的策略来填充 DataFrame 中的缺失值。

示例代码:填充缺失值

# 使用前一个值填充缺失值
df = df.fill_none("forward")

获取所有列

您可以轻松地获取 DataFrame 中的所有列名。

示例代码:获取所有列

# 获取 DataFrame 中的所有列名
columns = df.columns

空值计数

您可以轻松地计算 DataFrame 中的空值数量。

示例代码:空值计数

# 计算 DataFrame 中的空值数量
null_counts = df.null_count()

列排序

您可以根据不同的列对 DataFrame 进行排序。

示例代码:列排序

# 根据列 "a" 对 DataFrame 进行降序排序
df = df.sort("a", reverse=True)

转为 NumPy

您可以将 DataFrame 转换为 NumPy 数组。

示例代码:转为 NumPy

# 将 DataFrame 转换为 NumPy 数组
numpy_array = df.to_numpy()

转为 Pandas

您可以将 DataFrame 转换为 Pandas DataFrame。

示例代码:转为 Pandas

# 将 DataFrame 转换为 Pandas DataFrame
pandas_df = df.to_pandas()

以上代码展示了如何在 Polars 中进行常用的数据操作。更多详细信息和高级用法,请访问Polars 官方文档