作者:Edison_G
Python3.10的第二个alpha版本已在11月初发布,相比于不久前发布的3.9版本,新版本对类型注释扩展、zip、位计数、字典映射又有了新的改进。
——链接(中文文档):https://docs.python.org/zh-cn/3.10/c-api/intro.html
Python3.9刚刚发布不久,Python3.10的第二个alpha版本也已于11月初发布。透过这个版本,我们或许可以一窥Python的未来改变。
Python3.10第二个alpha版本的新功能包括以下三大部分:
- 类型注释扩展
- 为什么类型注释很重要
- 新方法和行为
类型注释扩展
Python3.9版本对类型提示与注释进行了彻底的修改和清理。Python3.10版本似乎延续了这一趋势,Python3.10 alpha 2版本将类型注释功能进行了扩展。
从Python 3.0到Python 3.10类型注释的变化。
类型注释的延迟评估
类型注释的评估始终在函数定义时执行,这意味着类型注释以自上而下的方式逐行进行评估。这看似合乎逻辑,但存在两个问题:
引用尚未定义的类型(前向引用)的类型提示无效,必须以字符串形式表示。例如应该是「“int”」而不是「int」(尽管这仅适用于自定义类型,而不是内置 / 预定义类型)。
由于需要执行类型提示,模块导入的速度减慢。
因此,注释将被存储在 __annotations__,然后进行集中评估,即允许前向引用并首先执行模块导入(以减少初始化时间)。
Union 操作符类型
Python 3.10引入了 | 操作符。在注释数据类型时,可以使用 | 作为OR。例如,存在一个预计为int或float的变量,我们可以将其写作int | float:
def f(x: *int | float*) -> float:
return x * 3.142 f(1)
# passf(1.5)
# passf('str')
# linter will show annotation error
在3.10之前的版本中,等效运算符使用type.Union方法进行编写,例如Union[int, float]。
TypeAlias 注释
回到前向引用问题,避免前向引用的常见解决方案是将它们作为字符串写入。
但是,将类型作为字符串编写,会在将这些类型分配给变量时出现问题,因为Python假设字符串文本类型注释只是一个字符串。
在使用类型注释的地方使用该类型注释变量将返回错误。例如:
MyType = "ClassName"
# ClassName is our type annotationdef foo() -> MyType: ...
我们正在尝试使用MyType作为类型的别名(alias),但是MyType将被读取为字符串值,而不是类型别名。
只要在后面的代码中定义了ClassName,这就是有效的。目前,这将引发注释错误。
为了解决这个问题,该版本添加了一个显式地将MyType识别为类型别名的方法:
from typing_extensions import TypeAliasMyType: TypeAlias = "ClassName"def foo() -> MyType: ...ORMyType: TypeAlias = ClassName # if we have defined ClassName alreadydef foo() -> MyType: ...
为什么类型注释很重要
Python的强大之处在于它易于使用和掌握,原因之一就是我们不需要在整个代码中显式地定义类型。
这看似违背常理,但允许开发人员定义类型可以极大地增强代码库的可读性和可维护性。例如从transformers库的源代码中提取如下内容:
def get_default_model(targeted_task: Dict, framework: Optional[str], task_options: Optional[Any]) -> str:
...
class DefaultArgumentHandler(ArgumentHandler):
...
@staticmethod
def handle_kwargs(kwargs: Dict) -> List:
...
@staticmethod
def handle_args(args: Sequence[Any]) -> List[str]:
即使没有上下文,我们也可以读取这些代码,并了解应该向这些函数、类和方法提供哪些数据,以及应该返回哪些数据类型。
在复杂的代码库(甚至是简单的代码库)中,类型注释可以极大地提高可读性。同时,并不是每个开发者都想(或需要)使用类型注释,因此可选的、无异常的功能可以达到完美的平衡。
新方法和实现
除了类型注释方面的更改之外,3.10alpha 2版本对其他核心功能也进行了一些更新。
为Zip添加等长标记
第一个是PEP 618,它为zip()函数添加了一个可选的strict标记。设置strict = True,如果zip的两个输入长度不等,则会引发错误。
左侧无strict=True标记,没有引发错误,并且较长的列表被截断用于创建压缩生成器。如果设置strict = True,就会引发错误。
整数的位计数
也叫做「总体计数」(population count)。这一新方法允许计算整数二进制表示中1的个数,只需写int.bit_count()即可:
字典视图映射
三种字典方法dict.keys()、dict.values()和dict.items() 返回字典的不同视图。现在,将 mapping 属性添加到每个视图对象。
这一新属性是types.MappingProxyType对象,用来包装原始字典。如果在视图上调用它,则返回原始字典。