Runtime内存模型探究_数据模型

Objective-C是一种通用、高级、面向对象的编程语言。它扩展了标准的ANSI C编程语言,将Smalltalk式的消息传递机制加入到ANSI C中。

可以这么理解,Objective-C = C + Runtime,Runtime是将C语言具有面向对象功能的推动剂,是iOS开发中的核心概念。我们可以在苹果开源的 runtime(当前的最新版本objc4-779.1.tar.gz)中可以发现一些 Objective-C 对象模型的实现细节。

NSObject的实现

OC中几乎所有的类都继承自 ​NSObject​,OC的动态性也是通过NSObject实现的,那就从NSObject开始探索。

在 ​runtime​​源码中的 ​NSObject.h​​中,我们可以找到 ​NSObject​的定义:

  1. @interface NSObject <NSObject> {
  2. Class isa OBJC_ISA_AVAILABILITY;
  3. }

可以看出 ​NSObject​​里有一个指向 ​Class​​的 ​isa​​,其中对于Class的定义在 ​objc.h​:

  1. /// An opaque type that represents an Objective-C class.

  2. typedef struct objc_class *Class;

  3. /// Represents an instance of a class.

  4. struct objc_object {

  5. Class _Nonnull isa OBJC_ISA_AVAILABILITY;

  6. };

objc_class​​代表类对象, ​objc_object​​代表实例对象, ​objc_object​​的 ​isa​​指向 ​objc_class​。这里可以得出一个结论,实例对象的isa是指向类(类对象)的。其实类(objc_class)也有一个isa属性,那它指向什么呢?

Meta Class(元类)

这里runtime为了设计上的统一性,引入了元类(meta class)的概念。

对象的实例方法调用时,通过对象的 isa 在类中获取方法的实现。类对象的类方法调用时,通过类的 isa 在元类中获取方法的实现。

objc_class​的isa指向meta class,甚至meta class也有isa指针,它指向根元类(root meta class)。实例对象,类对象,元类和根元类的关系如下图所示:

Runtime内存模型探究_数据模型_02

类和元类形成了一个完整的闭环,其中有两条关系需要注意:

  • 元类的isa均指向根元类,根元类指向自己
  • 根元类继承根类(NSObject)

ObjectiveC1.0数据模型

我们可以在 ​runtime.h​​中查看 ​objc_class​的定义。

  1. struct objc_class {

  2. Class _Nonnull isa OBJC_ISA_AVAILABILITY;

  3. #if !__OBJC2__

  4. Class _Nullable super_class OBJC2_UNAVAILABLE;

  5. const char * _Nonnull name OBJC2_UNAVAILABLE;

  6. long version OBJC2_UNAVAILABLE;

  7. long info OBJC2_UNAVAILABLE;

  8. long instance_size OBJC2_UNAVAILABLE;

  9. struct objc_ivar_list * _Nullable ivars OBJC2_UNAVAILABLE;

  10. struct objc_method_list * _Nullable * _Nullable methodLists OBJC2_UNAVAILABLE;

  11. struct objc_cache * _Nonnull cache OBJC2_UNAVAILABLE;

  12. struct objc_protocol_list * _Nullable protocols OBJC2_UNAVAILABLE;

  13. #endif

  14. } OBJC2_UNAVAILABLE;

  15. /* Use `Class` instead of `struct objc_class *` */

注意这两个宏命令:​!__OBJC2__​​和 ​OBJC2_UNAVAILABLE​​,他们均是为了提示当前的 ​objc_class​结构是Objc2之前的结构设计,即Objc1.0的设计。

从这个 ​objc_class​​的定义我们可以看出它包含了超类的指针( ​super_class​​),类名( ​name​​),实例大小( ​instance_size​​), ​objc_ivar_list​​成员变量列表的指针( ​ivars​​),指向 ​objc_method_list指针的指针( ​methodLists​)。

注意 ​*methodLists​​是指向方法列表的指针,可以动态修改 ​*methodLists​的值来添加成员方法,这也是Category实现的原理,同样解释了Category不能添加属性的原因。

剩下的 ​objc_cache​​代表函数的缓存列表, ​objc_protocol_list​代表协议列表。

Objective语言历史

我在网上查资料的时候发现关于runtime的文章非常多,但提示数据模型在OC1.0和2.0之间区别的非常少,其实这一点很重要的。这也是为什么我将这段标题命名为Objective-C1.0数据模型的原因。

这里补一点 ​Objective-C​语言的发展历史(维基百科):


Objective-C1.0 即Objective-C++ 由Stepstone 公司的布莱德·考克斯(Brad Cox)和 汤姆·洛夫(Tom Love) 在 1980 年代发明。它是GCC的一个前端,它可以编译混合C++与Objective-C语法的源文件。Objective-C++是C++的扩展,类似于Objective-C是C的扩展。

Objective-C2.0 在2006年7月苹果全球开发者会议中,Apple宣布了“Objective-C 2.0”的发布,其增加了“现代的垃圾收集,语法改进,运行时性能改进,以及64位支持”。


Objective2.0数据模型

可以在objc-runtim-new.h文件找到新版对 ​objc_class​的数据模型定义:

  1. struct objc_class : objc_object {

  2. // Class ISA;

  3. Class superclass;

  4. cache_t cache; // formerly cache pointer and vtable

  5. class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags

  6. class_rw_t *data() const {

  7. return bits.data();

  8. }

  9. }

  10. struct objc_object {

  11. private:

  12. isa_t isa;

  13. }

  14. union isa_t

  15. {

  16. isa_t() { }

  17. isa_t(uintptr_t value) : bits(value) { }

  18. Class cls;

  19. uintptr_t bits;

  20. }

会发现 ​objc_class​​不再是一个单独的结构体,而是继承于 ​objc_object​​,objc_object内部的 ​isa​​变成了 ​isa_t​的联合体。

classdatabits_t

我们再回来看类中的其他属性,之前表示类的属性、方法、以及遵循的协议都放在了 ​class_data_bits_t​​中,更准确的说是放在了 ​class_rw_t​。

  1. struct class_data_bits_t {

  2. friend objc_class;

  3. // Values are the FAST_ flags above.

  4. uintptr_t bits;

  5. class_rw_t* data() const {

  6. return (class_rw_t *)(bits & FAST_DATA_MASK);

  7. }

  8. }

  9. struct class_rw_t {

  10. // Be warned that Symbolication knows the layout of this structure.

  11. uint32_t flags;

  12. uint16_t version;

  13. uint16_t witness;

  14. const class_ro_t *ro;

  15. method_array_t methods;

  16. property_array_t properties;

  17. protocol_array_t protocols;

  18. }

  19. struct class_ro_t {

  20. uint32_t flags;

  21. uint32_t instanceStart;

  22. uint32_t instanceSize;

  23. #ifdef __LP64__

  24. uint32_t reserved;

  25. #endif

  26. const uint8_t * ivarLayout;

  27. const char * name;

  28. method_list_t * baseMethodList;

  29. protocol_list_t * baseProtocols;

  30. const ivar_list_t * ivars;

  31. const uint8_t * weakIvarLayout;

  32. property_list_t *baseProperties;

  33. }

这里面引入了 ​class_rw_t​​和 ​class_ro_t​​(rw-readwrite,ro-readonly)两个结构体。可以看到 ​class_rw_t​​是包含一个常量指针 ​ro​​,结构体为 ​class_ro_t​​。这里存储了当前类在编译期就已经确定的属性、方法以及遵循的协议。在 ObjC 运行时的时候会调用 ​realizeClass​​ 方法,将 ​class_ro_t​​传入 ​class_rw_t​,所以新版的动态性是通过这种方式实现的。

cache_t

  1. struct cache_t {

  2. static bucket_t *emptyBuckets();

  3. struct bucket_t *buckets();

  4. mask_t mask();

  5. mask_t occupied();

  6. }

  7. struct bucket_t {

  8. // IMP-first is better for arm64e ptrauth and no worse for arm64.

  9. // SEL-first is better for armv7* and i386 and x86_64.

  10. #if __arm64__

  11. explicit_atomic<uintptr_t> _imp;

  12. explicit_atomic<SEL> _sel;

  13. #else

  14. explicit_atomic<SEL> _sel;

  15. explicit_atomic<uintptr_t> _imp;

  16. #endif

  17. }

cache_t​​是 ​objc_class​​中的缓存结构体,里面通过 ​bucket_t​​结构体存储一些最近调用的函数。设置cache最大的原因就是OC为动态语言,函数的执行是通过消息调用实现的,消息调用会首先查找当前类中的方法列表,如果找不到会查找父类,直到检索至 ​NSObject​​依然找不到函数实现,就会进入消息发流程。而为了节省每次查找函数表的开销,发明了 ​cache_t​​。我们从 ​bucket_t​的内联函数中可以看出,缓存的SEL和IMP都是在内存中进行加载的。

method_t

  1. struct method_t {

  2. SEL name;

  3. const char *types;

  4. MethodListIMP imp;

  5. struct SortBySELAddress :

  6. public std::binary_function<const method_t&,

  7. const method_t&, bool>

  8. {

  9. bool operator() (const method_t& lhs,

  10. const method_t& rhs)

  11. { return lhs.name < rhs.name; }

  12. };

  13. };

这是函数的结构体,里面包含3个成员变量。​SEL​​是方法的名字name。​types​​是类型编码,类型可参考Type Encoding。​IMP​是一个函数指针,指向的是函数的具体实现。在runtime中消息传递和发的目的就是为了找到IMP,并执行函数。

数据模型对比

最后总结下,Objc1.0到2.0的对比:

Runtime内存模型探究_objective-c_03

Runtime内存模型探究_类对象_04

这两张图片引用自寒神博客。

注:因为参考的runtime版本不一致可能会有少许差别,但是整体都是一致的。

参考链接

  • 深入解析 ObjC 中方法的结构
  • 神经病院 Objective-C Runtime 入院第一天—— isa 和 Class