Polars 常用操作指南
Polars 是一个用 Rust 编写的 DataFrame 库,它提供了灵活且高效的数据操作方法。
添加列
在 Polars 中,您可以轻松地为 DataFrame 添加新列。
示例代码:添加列
import polars as pl
# 创建一个示例 DataFrame
df = pl.DataFrame({
"a": [1, 2, 3],
"b": ["foo", "bar", "baz"]
})
# 添加新列 "c",值为 "p", "q", "r"
df = df.with_columns(pl.Series(["p", "q", "r"]).alias("c"))
类型转换
Polars 允许您在不同的数据类型之间进行转换。
示例代码:类型转换
# 将列 "a" 从整数类型转换为浮点数类型
df = df.with_columns(pl.col("a").cast(float))
重命名列
您可以轻松地重命名 DataFrame 中的列。
示例代码:重命名列
import polars as pl
# 创建一个示例 DataFrame
df = pl.DataFrame({
"a": [1, 2, 3],
"b": ["foo", "bar", "baz"]
})
# 重命名列 "a" 为 "banana"
df.columns = ["banana", "orange"]
删除列
您可以从 DataFrame 中删除列。
示例代码:删除列
# 删除列 "b"
df = df.drop("b")
删除空值
您可以轻松地删除 DataFrame 中的空值。
示例代码:删除空值
# 删除 DataFrame 中的所有空值
df = df.drop_nulls()
填充缺失值
您可以使用不同的策略来填充 DataFrame 中的缺失值。
示例代码:填充缺失值
# 使用前一个值填充缺失值
df = df.fill_none("forward")
获取所有列
您可以轻松地获取 DataFrame 中的所有列名。
示例代码:获取所有列
# 获取 DataFrame 中的所有列名
columns = df.columns
空值计数
您可以轻松地计算 DataFrame 中的空值数量。
示例代码:空值计数
# 计算 DataFrame 中的空值数量
null_counts = df.null_count()
列排序
您可以根据不同的列对 DataFrame 进行排序。
示例代码:列排序
# 根据列 "a" 对 DataFrame 进行降序排序
df = df.sort("a", reverse=True)
转为 NumPy
您可以将 DataFrame 转换为 NumPy 数组。
示例代码:转为 NumPy
# 将 DataFrame 转换为 NumPy 数组
numpy_array = df.to_numpy()
转为 Pandas
您可以将 DataFrame 转换为 Pandas DataFrame。
示例代码:转为 Pandas
# 将 DataFrame 转换为 Pandas DataFrame
pandas_df = df.to_pandas()
以上代码展示了如何在 Polars 中进行常用的数据操作。更多详细信息和高级用法,请访问Polars 官方文档。