1 基于 C语言的底层机制

说来你可能不信,Python 开发一年后,我们才加入“类(class)”的概念。为了解这段历史,首先要理解 Python 的一些底层实现。

Python 的底层,实际上是基于一个用C语言实现的代码解析器,或者说“虚拟机”,以及也是用C语言实现的几种基本数据类型。虽然 Python 底层架构使用了各种“对象”,但因为C语言不是面向对象语言,所以这些对象的实现,实际上是基于一些特定的数据结构与方法指针。

Python 虚拟机定义了每个对象类型都可以,或者必须实现的数十种标准方法(比如“get attribute”、“add” 、“call”等)。每个对象类型都有一个静态存储的数据空间,其中包含一系列方法指针,每个指针指向一种标准方法。不过,有些标准方法不是必须实现的,于是会出现空指针,这时,Python 虚拟机会抛出运行时错误,或者有时也提供这些方法的默认实现。

另外,对象类型的数据空间里也包含很多其它数据,包括一个存储这个类型的特有方法的列表。每种方法由一个字符串(方法名称)和一个方法指针(具体实现)组成。

Python 独特的自省(introspection)机制,就是基于其独特的,可以在运行时作为一种对象的类型数据结构。

Python 的底层完全是基于 C 语言的,事实上其所有标准方法都是用 C 语言写的。最开始时,Python 解析器只支持纯粹的 Python 函数和用 C 语言实现的这些方法。我记得应该是我们当时的同事,Siebren van der Zee,建议我们应该像 C++ 一样支持“类”,从而实现自定义对象。

2 类的实现

我采用了最简单的设计来实现用户自定义对象:所有对象的实例都用一种新的内置对象表示,这个内置对象包含一个指针和一个字典,指针指向这个实例对应的“类对象(class object)”,而字典中包含了这个对象实例的各种变量,也被称为“实例字典”。

在此实现中,实例字典中的变量是这个实例所具有的独特变量,而类对象则包含这个类的所有实例所共享的东西——尤其是方法。

而在实现类对象的时候,我依然采用了最简单的设计:类的所有方法都被存储在一个字典中,其对应的键值就是方法的名称。我把它叫做“类字典(class dictionary)”。

为支持继承,类对象也会存储指向父类对象的指针。当时,我对类的理解还非常浅薄,不过对 C++ 刚支持的多重继承特性有所了解。因此我想,既然要支持继承,不如也同时支持一个简单版的多重继承。于是,每个类对象都允许有多个父类。

基于这种实现,对象的底层运作机制其实非常简单:不论是改变实例变量还是类变量,都只是修改对应字典的数据而已。

比如说,设置实例变量时,只需要更新它的实例字典;类似地,获取实例变量时,首先检查实例字典中是否有这个变量,如果没有,就在类对象以及父类对象的字典中查找。

不过,在父类对象中查找变量还涉及一些其它问题。实例从类对象和父类对象中获取变量的过程,一般与查找方法的过程一样。如前文所说,方法存储在类对象字典中,由这个类的所有实例共享。因此,调用方法的时候,一般不会在实例字典中找到,而必须查找类对象的字典,之后再从父类对象字典中递归查找。

Python 的最初的默认方法解析顺序(method resolution order,MRO)是采用深度优先,从左至右算法。不过,后来的版本采用了更成熟的 MRO (C3算法),我们会在之后的博文中讨论。

3 简单,但灵活

我希望 Python 类的实现尽量简单。因此,Python 在查找方法的时候,并不会做错误检查或一致性验证。比如说,如果一个类重载了父类的一个方法,Python 不会检查这个重载的方法是否与父类方法有相同的参数,或者相同的调用方式。前文所说的方法解析算法,只是单纯地返回它找到的第一个方法而已。

另外,这种设计还导致了一些其它特性。比如说,虽然类字典最初是用于存储方法的,但也不是不能保存其它对象。因此,如果在类字典中存储整数或字符串,就可以作为类变量——即由所有实例共享的变量。

Python 类的实现非常简单,但也非常灵活。

比如说,因为采用了这种实现方式,Python 中的类也是“一级对象(first-class objects)”,因而在程序运行时可以很容易内省到(introspected),而我们也可以对类进行动态修改。

举例来说,在类对象创建后,通过更新类字典,我们依然可以增加或修改类的方法。(作者注:后来的新式类中,dict 类的修改被控制了,我们依然可以动态地修改类,但必须调用参数设置方法,而不是直接使用 dict 类。)而又因为 Python 是动态类型语言,这就意味着,这个类,及其子类的所有实例,都会立即更新其方法。

类似的,通过修改实例字典,实例的变量也可以动态增加、修改或删除(SmallTalk 语言在对象创建时就限制了实例的变量,与之相比,Python 的这个特性可以说相当自由了)。