介绍
Python 3.7 中有一个新特性, 你可以使用一个装饰器 @dataclass来简化创建数据类的过程,新创建的数据类将自带有__init__和__repr__。
数据类是一种用来存储数据的类,这种类往往不需要自定义的方法。通常,我们也管它叫数据结构。例如,一个存储点的三维坐标值的类,往往就只需要三个字段 (x, y, z)。
然而,如果我们用以前的方式实现一个数据类,那我们不可避免地需要自己编写一个__init__方法,一个字符串表示的内置方法,和一个比较函数等等。这些方法的逻辑显而易见,如果语言能够自动地处理,那就再好不过了。
事实上,其他一些语言,如 Kotlin,已经提供了构建数据类的便捷方式,Java也可以通过Lombok库来使用 @Data标记构建数据类。
例子
这里是使用dataclass的一个例子
默认情况下,装饰器会自动生成初始化函数、比较函数和字符串表示函数。
换言之,上面代码等同于下面的旧式代码:
注意这个例子也可以使用 namedtuple完成,但是实现的代码可读性就差了很多,虽然确实比上面例子更短了:
DATACLASS参数
@dataclass装饰器可以接受几个参数来控制自动生成的方法的行为:init: 如果 True, 生成__init__方法。
repr: 如果 True, 生成__repr__方法。
eq: 如果 True, 生成__eq__方法,比较逻辑就是把数据当作一个元组来比较。
order: 如果 True, 生成__lt__,__le__,__gt__, 和__ge__方法。
unsafe_hash: 如果 False, 依据eq和frozen的值生成__hash__方法。 如果 True,生成__hash__方法。
frozen: 如果 True, 生成的对象就是不可变的 (只读).
字段配置
在 dataclasses模块中, 有一个field函数,它可以用来做字段级别的配置:
通过它你可以控制一个字段的默认值, 该字段是否应该显示在 __repr__中,是否应该被比较函数忽略,是否应该计算在__hash__中, 等等。
初始化后处理
生成的 __init__代码会调用一个叫__post_init__的函数。 如果你需要依据基础数据生成一些衍生数据,那么这个函数会很有用。 注意如果__init__方法没有生成, 那么__post_init__也不会执行。
其他DATACLASS方法
dataclasses 模块还提供了很多其他的有用的函数:fields: 返回Field对象的元组。 一个Field对象包含一个字段的配置。
asdict: 将数据类实例转换为对应字段的字典。
astuple: 将数据类实例转换为对应字段的元组。
make_dataclass: 动态创建一个数据类。
replace: 拷贝数据类实例,并修改部分字段。
is_dataclass: 判断一个对象是否是指定数据类的对象。
英文原文:https://www.codingame.com/playgrounds/37245/python-dataclass