以下是根据您提供的网页内容,概括性的转为Markdown格式的总结,包含了一些代码例子:
Polars 时间戳处理指南
Polars 是一个用 Rust 编写的 DataFrame 库,使用 Arrow 作为其底层数据结构。它的目标是通过并行化 DataFrame 上的查询,提供一个快速的解决方案。
时间戳数据类型
Polars 提供了 4 种时间数据类型:
-
pl.Date
:用于日期对象,表示自 UNIX 纪元以来的天数,为 32 位有符号整数。 -
pl.Datetime
:用于 datetime 项目,表示自 UNIX 纪元以来的纳秒数,为 64 位有符号整数。 -
pl.Time
:编码为午夜后的纳秒数。
Polars 字符串 (pl.Utf8
) 数据类型可以解析为它们中的任何一个。您可以让 Polars 尝试猜测日期/time 的格式,或者显式提供fmt
规则。
举例来说(查看此 链接 以获取全面列表): -
"%Y-%m-%d"
对于"2020-12-31"
-
"%Y/%B/%d"
对于"2020/December/31"
-
"%B %y"
对于"December 20"
解析时间戳
下面是一个简单的例子,展示了如何将字符串解析为日期:
import polars as pl
dataset = pl.DataFrame({"date": ["2020-01-02", "2020-01-03", "2020-01-04"], "index": [1, 2, 3]})
q = dataset.lazy().with_columns(pl.col("date").str.strptime(pl.Date, "%Y-%m-%d"))
df = q.collect()
这段代码将字符串列 "date"
解析为日期类型,并创建了一个新的 DataFrame。
更多详细信息和高级用法,请访问Polars 官方文档。
以上是根据您提供的链接内容制作的 Markdown 格式的总结。更多详细信息和高级用法,建议您访问 Polars 官方文档以获取完整信息。