这篇文章是对于自己学习 App编译过程的一个总结
学习的相关文章
本文的大纲
大纲.png
为何要了解
自己的兴趣,解开一些疑惑;
有利于解决一些编译过程中出现的问题;
对于优化App有很大的帮助。
什么是编译
为什么要编译
我们通常所使用的编程语言编写的代码,计算机的CPU(只能执行二进制代码)无法执行,所以要编译。
为什么要编译
什么是编译
利用编译程序将高级语言所编写的代码变为CPU可执行的代码的过程就叫编译。
编译_百度词条.png
App的编译过程
我分别用OC和Swift语言创建两个Demo,通过BulidLog看一下整个编译过程:
BuildLog_OC.png
BuildLog_Swift.png
Build的得到的.app也可以通过查看包内容,直观的看到得到的文件
.app包内容.png
根据图中和参考的文章总结一下 iOS 项目编译过程:
写入辅助文件:将项目的文件结构对应表、将要执行的脚本、项目依赖库的文件结构对应表写成文件,方便后面使用;
创建App架构:为填充后面步骤编译得到的文件等;
运行预设脚本:Cocoapods 会预设一些脚本,当然你也可以自己预设一些脚本来运行。这些脚本都在 Build Phases 中可以看到;
编译.m文件:这个过程是由LLVM完成的,编译成一个可执行文件(Mach-0);
链接编译后得到的文件;
拷贝项目中的资源,比如 图片资源;
编译 storyboard
编译 asset文件:图片如果使用 Assets.xcassets 来管理图片,那么这些图片将会被编译成机器码,除了 icon 和 launchImage;
处理info.plist ;
执行CocoaPod脚本;
拷贝swift标准包;
构建.app并签名;
完成打包。
以上,就是iOS项目大体的编译过程,下面说一下解释代码用到的LLVM 。
什么是LLVM
The LLVM Project is a collection of modular and reusable compiler and toolchain technologies. Despite its name, LLVM has little to do with traditional virtual machines. The name "LLVM" itself is not an acronym; it is the full name of the project.
LLVM项目是模块化、可重用的编译器和工具链技术的集合。尽管名为LLVM,但它与传统的虚拟机几乎没有关系。“LLVM”这个名字本身并不是首字母缩略词;这是项目的全称。
LLVM在编译过程中分为了三个模块: 前端、中间优化器和后端 。(跟web前端,service后端没有任何关系)。
LLVM各个模块的作用:
前端:对目标语言代码进行语法分析,语义分析,生成中间代码。在这个过程中,会进行类型检查,如果发现错误或者警告会标注出来在哪一行;
中间优化器:对中间代码进行优化,去除冗余代码,这个过程会进行BitCode的生成,链接期优化等;
后端:先进行与机器无关的代码优化,生成汇编语言,在生成汇编语言之后会再进次进行与机器相关的代码优化,最后将各个文件的机器代码链接。
在iOS中,OC和Swift两种语言的编译在前端是有差别的:OC中使用的编译器前端为:Clang,在Swift中使用的编译器前端为swift自己编写的,这个我们可以在BuildLog里面具体看到。
BuildLog_OC_compiler.png
BuildLog_Swift_compiler.png
OC的文件编译处理过程:
Objective-C 的文件中,只有 .m 文件会被编译 .h 文件只是一个暴露外部接口的头文件,它的作用是为被编译的文件中的代码做简单的共享,并且因为OC没有private和public的用法,用.h和.m来实现private和public。
预处理 :处理一些预处理指令( 比如#define、#ifdef,#else,#endif等)并将预处理后的代码进行符号化处理,以便下一步进行词法分析和语义分析;
词法分析和语义分析:
<1> 将符号化的代码抽象为语法树(abstract syntax tree – AST);
<2> 静态分析:对语法树进行遍历分析,包括类型检查、实现检查(某个类是否存在某个方法)、变量使用,还会有一些复杂的检查,例如在 Objective-C 中,给某一个对象发送消息(调用某个方法),检查这个对象的类是否声明这个方法(但并不会去检查这个方法是否实现,这个错误是在运行时进行检查的),如果有什么错误就会进行提示。因此可见,Xcode 对 clang 做了非常深度的集成,在编写代码的过程中它就会使用 clang 来对代码进行分析,并及时对代码错误进行提示。
生成 LLVM 代码(也就是中间代码LLVM Intermediate Representation LLVM IR),并将代码递交给优化器,这也是LLVM前端 Clang的最后一步;
优化:将一些不合适且消耗内存的代码进行优化;
生成目标文件:这之后就是由LLVM后端完成了,将优化过的代码根据不同架构的 CPU 转化生成汇编代码,再生成对应的可执行文件,这样对应的 CPU 就可以执行了;
生成可执行文件(Mach - 0)。
以上的文件编译流程在文章的开头链接里有详细步骤和说明。
Swift的文件编译处理过程:
Swift编译器官方解释.png
总体而言,Swift编译器主要负责将Swift源代码转换为高效、可执行的机器代码。但是,Swift编译器前端还支持许多其他工具,包括与语法着色、代码完成和其他便利的IDE集成。本文件对Swift编译器的主要组件进行了高层描述:
解析:解析器是一个简单的递归解析器(在lib/Parse中实现),带有一个集成的、手工编码的lexer。解析器负责生成没有任何语义或类型信息的抽象语法树(AST),并对输入源的语法问题发出警告或错误。
语义分析:语义分析(在lib/Sema中实现)负责将解析后的AST转换为结构良好的、完全类型检查的AST形式,为源代码中的语义问题发出警告或错误。语义分析包括类型推断,如果成功,则表明从生成的经过类型检查的AST生成代码是安全的。
Clang导入:Clang导入器(在lib/ClangImporter中实现)导入Clang模块,并将它们导出的C或Objective-C api映射到相应的Swift api中。产生的导入的ast可以通过语义分析来引用。
SIL生成:Swift中间语言(SIL)是一种高级的、特定于Swift的中间语言,适用于Swift代码的进一步分析和优化。SIL生成阶段(在lib/SILGen中实现)将类型检查的AST降低为所谓的“原始”SIL。SIL的设计在doc /SIL.rst中进行了描述。
SIL保证转换:SIL保证转换(在lib/SILOptimizer/Mandatory中实现)执行影响程序正确性的附加数据流诊断(例如使用未初始化的变量)。这些转换的最终结果是“规范的”SIL。
SIL优化:SIL优化(在lib/Analysis、lib/ARC、lib/LoopTransforms和lib/Transforms中实现)对程序执行额外的高级特定于swift的优化,包括(例如)自动引用计数优化、去虚拟化和泛型专门化。
LLVM IR生成:IR生成(在lib/IRGen中实现)降低SIL到LLVM IR,此时LLVM可以继续优化并生成机器代码。
生成LLVM IR 之后的步骤就跟OC一样了。
与编译相关 (内容太多,未完待续)
Build Tabs